歡迎來(lái)到裝配圖網(wǎng)! | 幫助中心 裝配圖網(wǎng)zhuangpeitu.com!
裝配圖網(wǎng)
ImageVerifierCode 換一換
首頁(yè) 裝配圖網(wǎng) > 資源分類 > PPT文檔下載  

第二章并行程序設(shè)計(jì)基礎(chǔ)(并行計(jì)算基礎(chǔ))課件

  • 資源ID:242006809       資源大?。?span id="q6guasc" class="font-tahoma">191.36KB        全文頁(yè)數(shù):27頁(yè)
  • 資源格式: PPT        下載積分:20積分
快捷下載 游客一鍵下載
會(huì)員登錄下載
微信登錄下載
三方登錄下載: 支付寶登錄   QQ登錄   微博登錄  
二維碼
微信掃一掃登錄
下載資源需要20積分
郵箱/手機(jī):
溫馨提示:
用戶名和密碼都是您填寫的郵箱或者手機(jī)號(hào),方便查詢和重復(fù)下載(系統(tǒng)自動(dòng)生成)
支付方式: 微信支付   
驗(yàn)證碼:   換一換

 
賬號(hào):
密碼:
驗(yàn)證碼:   換一換
  忘記密碼?
    
友情提示
2、PDF文件下載后,可能會(huì)被瀏覽器默認(rèn)打開(kāi),此種情況可以點(diǎn)擊瀏覽器菜單,保存網(wǎng)頁(yè)到桌面,就可以正常下載了。
3、本站不支持迅雷下載,請(qǐng)使用電腦自帶的IE瀏覽器,或者360瀏覽器、谷歌瀏覽器下載即可。
4、本站資源下載后的文檔和圖紙-無(wú)水印,預(yù)覽文檔經(jīng)過(guò)壓縮,下載后原文更清晰。
5、試題試卷類文檔,如果標(biāo)題沒(méi)有明確說(shuō)明有答案則都視為沒(méi)有答案,請(qǐng)知曉。

第二章并行程序設(shè)計(jì)基礎(chǔ)(并行計(jì)算基礎(chǔ))課件

單擊此處編輯母版標(biāo)題樣式,單擊此處編輯母版文本樣式,第二級(jí),第三級(jí),*,*,*,第二章 并行計(jì)算基礎(chǔ),組成并行計(jì)算機(jī)的各個(gè)部分:,節(jié)點(diǎn)(node):每個(gè)節(jié)點(diǎn)由多個(gè)處理器構(gòu)成,可以直接進(jìn)行輸入輸出(I/O)操作;,互聯(lián)網(wǎng)絡(luò)(interconnect network):所有節(jié)點(diǎn)通過(guò)互聯(lián)網(wǎng)絡(luò)相互連接通信;,內(nèi)存(memory):內(nèi)存由多個(gè)存儲(chǔ)模塊組成,1、與節(jié)點(diǎn)對(duì)稱的分布在互聯(lián)網(wǎng)絡(luò)的兩側(cè);,2、位于各個(gè)節(jié)點(diǎn)的內(nèi)部。,第二章 并行計(jì)算基礎(chǔ)組成并行計(jì)算機(jī)的各個(gè)部分:,1,第二章 并行計(jì)算基礎(chǔ),內(nèi)存模塊與節(jié)點(diǎn)分離,內(nèi)存模塊位于節(jié)點(diǎn)內(nèi)部,第二章 并行計(jì)算基礎(chǔ)內(nèi)存模塊與節(jié)點(diǎn)分離內(nèi)存模塊位于節(jié)點(diǎn)內(nèi),2,多級(jí)存儲(chǔ)體系結(jié)構(gòu),解決內(nèi)存墻(memory wall)性能瓶頸問(wèn)題;,節(jié)點(diǎn)內(nèi)部的cache稱為二級(jí)cache(L2 cache);,處理器內(nèi)部更小的cache成為一級(jí)cache(L1 cache);,L1 cache連接CPU寄存器和L2 cache,負(fù)責(zé)緩存L2 cache中的數(shù)據(jù)到寄存器中。,多級(jí)存儲(chǔ)體系結(jié)構(gòu)解決內(nèi)存墻(memory wall)性能瓶頸,3,多級(jí)存儲(chǔ)體系結(jié)構(gòu),并行計(jì)算機(jī)的多級(jí)存儲(chǔ)結(jié)構(gòu)主要包括兩個(gè)問(wèn)題:,Cache的映射策略,即cache如何從內(nèi)存中取得數(shù)據(jù)進(jìn)行存儲(chǔ);,節(jié)點(diǎn)內(nèi)部或者節(jié)點(diǎn)之間內(nèi)存的訪問(wèn)模式。,cache原理,cache以cache線為基本單位,每條cache包含L個(gè)字,每個(gè)字8個(gè)字節(jié)。例如,L=4,則表示cache線包含4*8=32個(gè)字節(jié)。內(nèi)存空間分割成塊(block),每個(gè)塊大小與cache線長(zhǎng)度一致,數(shù)據(jù)在內(nèi)存和cache之間的移動(dòng)以cache線為基本單位。,For i=1 to M,Ai=Ai+2*Bi,如果操作數(shù)存在cache中,稱該次訪問(wèn)是命中的,否則,該次操作是“撲空”的。,多級(jí)存儲(chǔ)體系結(jié)構(gòu)并行計(jì)算機(jī)的多級(jí)存儲(chǔ)結(jié)構(gòu)主要包括兩個(gè)問(wèn)題:,4,多級(jí)存儲(chǔ)體系結(jié)構(gòu),cache的映射策略(內(nèi)存塊和cache線之間如何建立相互映射關(guān)系):,直接映射策略(direct mapping strategy):每個(gè)內(nèi)存塊只能被唯一的映射到一條cache線中,;,K路組關(guān)聯(lián)映射策略(K-way set association mapping strategy):Cache被分解為V個(gè)組,每個(gè)組由K條cache線組成,內(nèi)存塊按直接映射策略映射到某個(gè)組,但在該組中,內(nèi)存塊可以被映射到任意一條cache線;,全關(guān)聯(lián)映射策略(full association mapping strategy):內(nèi)存塊可以被映射到cache中的任意一條cache線。,多級(jí)存儲(chǔ)體系結(jié)構(gòu)cache的映射策略(內(nèi)存塊和cache線之,5,訪存模型,UMA(Uniform Memory Access)模型:該模型內(nèi)存模塊與節(jié)點(diǎn)分離,分別位于互聯(lián)網(wǎng)絡(luò)的兩側(cè),物理存儲(chǔ)器被所有節(jié)點(diǎn)共享;,所有節(jié)點(diǎn)訪問(wèn)任意存儲(chǔ)單元的時(shí)間相同;,發(fā)生訪存競(jìng)爭(zhēng)時(shí),仲裁策略平等對(duì)待每個(gè)節(jié)點(diǎn),即每個(gè)節(jié)點(diǎn)機(jī)會(huì)均等;,各節(jié)點(diǎn)的CPU可帶有局部私有高速緩存;,外圍I/O設(shè)備也可以共享,且每個(gè)節(jié)點(diǎn)有平等的訪問(wèn)權(quán)利。,訪存模型UMA(Uniform Memory Access),6,訪存模型,NUMA(Non-Uniform Memory Access)模型:該模型內(nèi)存模塊分布在各個(gè)節(jié)點(diǎn)內(nèi)部,所有局部?jī)?nèi)存模塊均構(gòu)成并行計(jì)算機(jī)的全局內(nèi)存模塊。內(nèi)存模塊在物理上是分布的,在邏輯上是全局共享的,這種模型也稱之為“分布式共享訪存模型”,物理存儲(chǔ)器被所有節(jié)點(diǎn)共享,任意節(jié)點(diǎn)可以直接訪問(wèn)任意內(nèi)存模塊;,節(jié)點(diǎn)訪問(wèn)內(nèi)存模塊的速度不同,訪問(wèn)本地存儲(chǔ)模塊的速度一般是訪問(wèn)其他節(jié)點(diǎn)內(nèi)存模塊的3倍以上;,發(fā)生訪存競(jìng)爭(zhēng)時(shí),仲裁策略對(duì)節(jié)點(diǎn)可能是不等價(jià)的;,各節(jié)點(diǎn)的CPU可帶有局部私有高速緩存(cache);,外圍I/O設(shè)備也可以共享,但對(duì)各節(jié)點(diǎn)是不等價(jià)的。,訪存模型NUMA(Non-Uniform Memory Ac,7,訪存模型,COMA(Cache-Only Memory Access)模型:全高速緩存存儲(chǔ)訪問(wèn)模型,各處理器節(jié)點(diǎn)中沒(méi)有存儲(chǔ)層次結(jié)構(gòu),全部高速緩存組成了全局地址空間;,利用分布的高速緩存目錄進(jìn)行遠(yuǎn)程高速緩存的訪問(wèn);,COMA中的高速緩存容量一般都大于2級(jí)高速緩存容量;,使用COMA時(shí),數(shù)據(jù)開(kāi)始時(shí)可以任意分配,因?yàn)樵谶\(yùn)行時(shí)它最終會(huì)被遷移到要用到它的地方。,訪存模型COMA(Cache-Only Memory Acc,8,并行計(jì)算模型,SIMD同步并行計(jì)算模型,共享存儲(chǔ)的SIMD模型(PRAM模型);,分布存儲(chǔ)的SIMD模型(SIMD互聯(lián)網(wǎng)絡(luò)模型),MIMD異步并行計(jì)算模型,異步PRAM模型,BSP模型,LogP模型,C3,模型,并行計(jì)算模型 SIMD同步并行計(jì)算模型,9,同步并行計(jì)算模型,SIMD共享存儲(chǔ)模型假定存在著一個(gè)容量無(wú)限大的共享存儲(chǔ)器,有有限或無(wú)限個(gè)功能相同的處理器,且均具有簡(jiǎn)單的算術(shù)運(yùn)算和邏輯判斷功能,在任何時(shí)刻各處理器均可通過(guò)共享存儲(chǔ)單元相互交換數(shù)據(jù)。,SIMD共享存儲(chǔ)模型(PRAM模型),PRAM-EREW(Exclusive-Read and Exclusive-Write),不允許同時(shí)讀和同時(shí)寫;,PRAM-CREW(Concurrent-Read and Exclusive-Write),允許同時(shí)讀但不允許同時(shí)寫;,PRAM-CRCW(Concurrent-Read and Concurrent-Write),允許同時(shí)讀和同時(shí)寫。,優(yōu)點(diǎn):,適合于并行算法的表達(dá)、分析和比較;,使用簡(jiǎn)單,很多諸如處理器間通信、存儲(chǔ)管理和進(jìn)程同步等并行計(jì)算機(jī)的低級(jí)細(xì)節(jié)均隱含于模型中;,易于設(shè)計(jì)算法和稍加修改便可運(yùn)行在不同的并行計(jì)算機(jī)上;,且有可能加入一些諸如同步和通信等需要考慮的方面。,同步并行計(jì)算模型SIMD共享存儲(chǔ)模型假定存在著一個(gè)容量無(wú)限大,10,同步并行計(jì)算模型,SIMD分布存儲(chǔ)模型,采用一維線性連接的SIMD模型,簡(jiǎn)記為SIMD-LC,采用網(wǎng)孔連接的SIMD模型,簡(jiǎn)記為SIMD-MC,采用樹(shù)形連接的SIMD模型,簡(jiǎn)記為SIMD-TC,采用樹(shù)網(wǎng)連接的SIMD模型,簡(jiǎn)記為SIMD-MT,采用立方連接的SIMD模型,簡(jiǎn)記為SIMD-CC,采用立方環(huán)連接的SIMD模型,簡(jiǎn)記為SIMD-CCC,采用洗牌交換連接的SIMD模型,簡(jiǎn)記為SIMD-SE,采用蝶形連接的SIMD模型,簡(jiǎn)介為SIMD-BF,采用多級(jí)互聯(lián)網(wǎng)絡(luò)連接的SIMD模型,簡(jiǎn)記為SIMD-MIN,同步并行計(jì)算模型SIMD分布存儲(chǔ)模型,11,MIMD異步計(jì)算模型APRAM模型,APRAM特點(diǎn):,每個(gè)處理器都有其本地存儲(chǔ)器、局部時(shí)鐘和局部程序,處理器間的通信經(jīng)過(guò)共享全局存儲(chǔ)器,無(wú)全局時(shí)鐘,各處理器異步地獨(dú)立執(zhí)行各自的指令,處理器任何時(shí)間依賴關(guān)系需明確地在各處理器的程序中加入同步障(Synchronization Barrier),一條指令可在非確定但有限的時(shí)間內(nèi)完成。,MIMD異步計(jì)算模型APRAM模型APRAM特點(diǎn):,12,MIMD異步計(jì)算模型PRAM模型,APRAM模型中有四類指令:,全局讀,將全局存儲(chǔ)單元中的內(nèi)容讀入本地存儲(chǔ)器單元中,局部操作,對(duì)本地存儲(chǔ)器中的數(shù)執(zhí)行操作,其結(jié)果存入本地存儲(chǔ)器中,全局寫,將本地存儲(chǔ)器單元中的內(nèi)容寫入全本地存儲(chǔ)器單元中,同步,同步是計(jì)算中的一個(gè)邏輯點(diǎn),在該點(diǎn)各處理器均需等待別的處理器到達(dá)后才能繼續(xù)執(zhí)行其局部程序,MIMD異步計(jì)算模型PRAM模型APRAM模型中有四類指,13,MIMD異步計(jì)算模型BSP模型,大同步并行BSP(Bulk Synchronous Parallel)模型 作為計(jì)算機(jī)語(yǔ)言和體系結(jié)構(gòu)之間的橋梁,由下述三個(gè)參數(shù)描述分布存儲(chǔ)的并行計(jì)算機(jī)模型:,處理器/存儲(chǔ)器模塊(下文簡(jiǎn)稱處理器);,處理器模塊之間點(diǎn)到點(diǎn)信息傳遞的路由器;,執(zhí)行以時(shí)間間隔L為周期的路障同步器。,MIMD異步計(jì)算模型BSP模型大同步并行BSP(Bulk,14,MIMD異步計(jì)算模型BSP模型,特點(diǎn):,將處理器和路由器分開(kāi),強(qiáng)調(diào)了計(jì)算任務(wù)和通信任務(wù)的分開(kāi),而路由器僅施行點(diǎn)到點(diǎn)的消息傳遞,不提供組合、復(fù)制或廣播等功能,這樣做既掩蓋了具體的互聯(lián)網(wǎng)絡(luò)拓?fù)?,又?jiǎn)化了通信協(xié)議;,采用路障方式的以硬件實(shí)現(xiàn)的全局同步是在可控的粗粒度級(jí),從而提供了執(zhí)行緊耦合同步式并行算法的有效方式,而程序員并無(wú)過(guò)分的負(fù)擔(dān);,在分析BSP模型的性能時(shí),假定局部操作可在一個(gè)時(shí)間步內(nèi)完成,而在每一超級(jí)步中,一個(gè)處理器至多發(fā)送或接受h條消息(h-relation),MIMD異步計(jì)算模型BSP模型特點(diǎn):,15,MIMD異步計(jì)算模型LogP,C3模型,LogP模型,一種分布存儲(chǔ)的、點(diǎn)到點(diǎn)通信的多處理機(jī)模型,其中通信網(wǎng)絡(luò)由一組參數(shù)來(lái)描述,但它并不涉及到具體的網(wǎng)絡(luò)結(jié)構(gòu),也不假定算法一定要用顯式的消息傳遞操作進(jìn)行描述。,C3,(Computation,Communication,Congestion),是一個(gè)與體系結(jié)構(gòu)無(wú)關(guān)的粗粒度的并行計(jì)算模型,旨在能反映計(jì)算復(fù)雜度,通信模式和通信期間潛在的擁擠等因素對(duì)粗粒度網(wǎng)絡(luò)算法的影響。,MIMD異步計(jì)算模型LogP,C3模型LogP模型,16,并行編程環(huán)境,比較流行的并行編程環(huán)境主要有3類:消息傳遞、共享存儲(chǔ)和數(shù)據(jù)并行,,共享存儲(chǔ)并行編程基于線程級(jí)細(xì)粒度并行,可移植性不如消息傳遞并行編程,但是,由于他們支持?jǐn)?shù)據(jù)的共享存儲(chǔ),所以并行編程的難度較小,但一般情況下,當(dāng)處理機(jī)個(gè)數(shù)較多時(shí),其并行性能明顯不如消息傳遞編程;,消息傳遞并行編程基于大粒度的進(jìn)程級(jí)并行,具有最好的可擴(kuò)展性,幾乎被所有當(dāng)前流行的各類并行計(jì)算機(jī)所支持,其具有較好的可擴(kuò)展性,但是,消息傳遞并行編程只能支持進(jìn)程間的分布式存儲(chǔ)模式,即各個(gè)進(jìn)程只能支持訪問(wèn)其局部?jī)?nèi)存空間,而對(duì)其他進(jìn)程的局部?jī)?nèi)存空間的訪問(wèn)只能通過(guò)消息傳遞來(lái)實(shí)現(xiàn),因此,學(xué)習(xí)和使用消息傳遞并行編程的難度均大于共享存儲(chǔ)和數(shù)據(jù)并行這兩種編程模式。,并行編程環(huán)境比較流行的并行編程環(huán)境主要有3類:消息傳遞、共享,17,并行編程環(huán)境,3類并行編程環(huán)境的主要特征的比較總結(jié),特征,消息傳遞,共享存儲(chǔ),數(shù)據(jù)并行,典型代表,MPI,PVM,OpenMP,HPF,可移植性,所有主流并行計(jì)算機(jī),SMP,DSM,SMP,DSM,MPP,并行粒度,進(jìn)程級(jí)大粒度,線程級(jí)細(xì)粒度,進(jìn)程級(jí)細(xì)粒度,并行操作方式,異步,異步,松散同步,數(shù)據(jù)存儲(chǔ)模式,分布式存儲(chǔ),共享存儲(chǔ),共享存儲(chǔ),數(shù)據(jù)分配方式,顯式,隱式,半隱式,學(xué)習(xí)入門難度,較難,容易,偏易,可擴(kuò)展性,好,較差,一般,并行編程環(huán)境3類并行編程環(huán)境的主要特征的比較總結(jié) 特征消息傳,18,并行計(jì)算性能評(píng)測(cè),加速比(Speedup):用,最優(yōu)串行算法的執(zhí)行時(shí)間,除以,并行程序的執(zhí)行時(shí)間,所得到的比值,能夠準(zhǔn)確描述對(duì)程序并行化之后所獲得的性能收益。,最優(yōu)串行算法的執(zhí)行時(shí)間除以并行程序的執(zhí)行時(shí)間所得到的比值,:,并行加速比就是指對(duì)于一個(gè)給定的應(yīng)用,并行算法的執(zhí)行速度相對(duì)于串行算法的執(zhí)行速度加快了多少倍。,并行計(jì)算性能評(píng)測(cè)加速比(Speedup):用最優(yōu)串行算法的執(zhí),19,并行計(jì)算性能評(píng)測(cè),并行程序執(zhí)行時(shí)間,等于從并行程序開(kāi)始執(zhí)行到所有進(jìn)程執(zhí)行完畢,墻上時(shí)鐘走過(guò)的時(shí)間,也稱為墻上時(shí)間(wall clock time)。對(duì)各個(gè)進(jìn)程,墻上時(shí)間可進(jìn)一步分解為計(jì)算CPU時(shí)間、通信CPU時(shí)間、同步開(kāi)銷時(shí)間、同步導(dǎo)致的進(jìn)程空閑時(shí)間;,計(jì)算CPU時(shí)間:進(jìn)程指令執(zhí)行所花費(fèi)的CPU時(shí)間,包括程序本身的指令執(zhí)行占用的時(shí)間和系統(tǒng)指令花費(fèi)的時(shí)間;,通信CPU時(shí)間;,同步開(kāi)銷時(shí)間;,進(jìn)程空閑時(shí)間:當(dāng)一個(gè)進(jìn)程阻塞式等待其他進(jìn)程的消息時(shí),CPU通常是空閑的,或者處于等待狀態(tài)。進(jìn)程空閑時(shí)間是指并行程序執(zhí)行過(guò)程中,進(jìn)程所有空閑時(shí)間總和。,并行計(jì)算性能評(píng)測(cè)并行程序執(zhí)行時(shí)間,20,并行計(jì)算性能評(píng)測(cè),加速比性能定律Amdahl定律,能夠計(jì)算并行程序相對(duì)于最優(yōu)串行算法在性能提升上的理論最大值表述是一種直觀、清楚的表述,他將程序劃分為可加速與不可加速兩大部分,程序總的加速比是一個(gè)關(guān)于程序中這兩部分所占比例以及可加速部分性能加速程度的函數(shù),如果只對(duì)50%的程序加速15%的話,整個(gè)程序總的加速比就是:,Amdahl定律:,S 表示執(zhí)行程序中串行部分的比例,n表示處理器核的數(shù)量。假設(shè)最優(yōu)串行算法的執(zhí)行時(shí)間為一個(gè)單位時(shí)間(也就是分子為1)。,處理器核在數(shù)量上能夠無(wú)限制的增加,但是無(wú)限的處理器核卻并不能帶來(lái)性能上的無(wú)限增長(zhǎng),無(wú)論如何,程序性能上的總是有個(gè)上限,這個(gè)要受限于串行部分所占的比例。,并行計(jì)算性能評(píng)測(cè)加速比性能定律Amdahl定律,21,程序性能優(yōu)化,串行程序性能優(yōu)化,是并行程序性能優(yōu)化的基礎(chǔ),一個(gè)好的并行程序首先應(yīng)該擁有良好的單機(jī)性能,影響程序單機(jī)性能的主要因素是程序的計(jì)算流程和處理器的體系結(jié)構(gòu),調(diào)用高性能庫(kù):充分利用已有的高性能程序庫(kù)是提高應(yīng)用程序?qū)嶋H性能最有效的途徑之一。許多著名的高性能數(shù)學(xué)程序庫(kù),如BLAS和FFTW;,選擇適當(dāng)?shù)木幾g器優(yōu)化選項(xiàng):現(xiàn)代編譯器在編譯時(shí)能夠?qū)Τ绦蜻M(jìn)行優(yōu)化,從而提高所生成的目標(biāo)代碼的性能。這些優(yōu)化功能通常是通過(guò)一組編譯選項(xiàng)來(lái)控制;,合理定義數(shù)組維數(shù):現(xiàn)代計(jì)算機(jī)為了提高內(nèi)存帶寬,多采用多體交叉并行存儲(chǔ)系統(tǒng),即使用多個(gè)獨(dú)立的內(nèi)存體,對(duì)他們統(tǒng)一編址。為了充分利用多體存儲(chǔ),在進(jìn)行連續(xù)數(shù)據(jù)訪問(wèn)時(shí)應(yīng)該使地址的增量與內(nèi)存體數(shù)的最大公約數(shù)盡量的小,特別要避免地址增量正好是體數(shù)的倍數(shù)的情況,因?yàn)榇藭r(shí)所有的訪問(wèn)將集中在一個(gè)存儲(chǔ)體中;,程序性能優(yōu)化 串行程序性能優(yōu)化是并行程序性能優(yōu)化的基礎(chǔ),,22,程序性能優(yōu)化,串行程序性能優(yōu)化,注意嵌套循環(huán)的順序:提高cache使用效率的一個(gè)簡(jiǎn)單原則就是盡量改善數(shù)據(jù)訪問(wèn)的局部性,數(shù)據(jù)訪問(wèn)的局部性包括空間局部性和時(shí)間局部性,空間局部性指的是訪問(wèn)了一個(gè)地址后,會(huì)緊接著訪問(wèn)他的鄰居地址。在嵌套的多循環(huán)語(yǔ)句中,循環(huán)順序往往對(duì)循環(huán)中數(shù)據(jù)訪問(wèn)的局部性有很大的影響。在編寫嵌套的多循環(huán)代碼時(shí),一個(gè)通用的原則就是盡量使最內(nèi)層循環(huán)的數(shù)據(jù)訪問(wèn)連續(xù)進(jìn)行;,數(shù)據(jù)分塊和循環(huán)展開(kāi)和一些其他方法,例如使用一些優(yōu)化工具如 Intel VTune等。,程序性能優(yōu)化串行程序性能優(yōu)化,23,程序性能優(yōu)化,并行程序性能優(yōu)化并行程序的性能優(yōu)化相對(duì)于串行程序而言就有些復(fù)雜了,最主要的是選擇好的并行算法和通信模式,下面介紹一下常用的并行程序優(yōu)化技術(shù),減少通信量、提高通信粒度:主要有三個(gè)途徑:較少通信量、提高通信粒度和提高通信中的并發(fā)度。提高通信粒度的有效方法就是減少通信次數(shù),盡可能將可以一次傳遞的數(shù)據(jù)合并起來(lái)一起傳遞;,全局通信盡量利用高效集合通信算法:當(dāng)組織多個(gè)進(jìn)程之間的集合通信時(shí),使用高效的通信算法可以大大地提高通信效率,從而降低通信開(kāi)銷;,挖掘算法的并行度,減少CPU空閑等待:些具有數(shù)據(jù)相關(guān)性的計(jì)算過(guò)程會(huì)導(dǎo)致并行運(yùn)行的部分進(jìn)程空閑等待。在這種情況下,可以考慮改變算法來(lái)消除數(shù)據(jù)相關(guān)性;,程序性能優(yōu)化并行程序性能優(yōu)化并行程序的性能優(yōu)化相對(duì)于串行,24,程序性能優(yōu)化,并行程序性能優(yōu)化,負(fù)載平衡:是導(dǎo)致進(jìn)程空閑等待的另外一個(gè)重要因素。在設(shè)計(jì)并行程序時(shí)應(yīng)該充分考慮負(fù)載平衡問(wèn)題,動(dòng)態(tài)調(diào)整負(fù)載時(shí)要考慮負(fù)載調(diào)整的開(kāi)銷及由于負(fù)載不平衡而引起的空閑等待對(duì)性能的影響,尋找最優(yōu)負(fù)載調(diào)整方案;,通信、計(jì)算的重疊:通常讓通信和計(jì)算重疊進(jìn)行,利用計(jì)算時(shí)間來(lái)屏蔽通信時(shí)間,是減少通信開(kāi)銷得非常有效的方法。實(shí)現(xiàn)通信與計(jì)算重疊的方法一般基于非阻塞通信,先發(fā)出非阻塞的消息接受或發(fā)送命令,然后處理與收發(fā)數(shù)據(jù)無(wú)關(guān)的計(jì)算任務(wù),完成這些計(jì)算后再等待消息收發(fā)的完成;,通過(guò)引入重復(fù)計(jì)算來(lái)減少通信,即以計(jì)算換通信:適當(dāng)引入一些重復(fù)計(jì)算,可以減少通信量和通信次數(shù)。由于當(dāng)前大部分并行計(jì)算機(jī)的計(jì)算速度遠(yuǎn)遠(yuǎn)大于通信速度,并且在一些情況下,當(dāng)一個(gè)進(jìn)程計(jì)算時(shí),別的進(jìn)程往往處于空閑等待狀態(tài),因而適當(dāng)引入重復(fù)計(jì)算可以提高程序的總體性能。,程序性能優(yōu)化并行程序性能優(yōu)化,25,第二章并行程序設(shè)計(jì)基礎(chǔ)(并行計(jì)算基礎(chǔ))課件,26,第二章并行程序設(shè)計(jì)基礎(chǔ)(并行計(jì)算基礎(chǔ))課件,27,

注意事項(xiàng)

本文(第二章并行程序設(shè)計(jì)基礎(chǔ)(并行計(jì)算基礎(chǔ))課件)為本站會(huì)員(txadgkn****dgknqu...)主動(dòng)上傳,裝配圖網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)上載內(nèi)容本身不做任何修改或編輯。 若此文所含內(nèi)容侵犯了您的版權(quán)或隱私,請(qǐng)立即通知裝配圖網(wǎng)(點(diǎn)擊聯(lián)系客服),我們立即給予刪除!

溫馨提示:如果因?yàn)榫W(wǎng)速或其他原因下載失敗請(qǐng)重新下載,重復(fù)下載不扣分。




關(guān)于我們 - 網(wǎng)站聲明 - 網(wǎng)站地圖 - 資源地圖 - 友情鏈接 - 網(wǎng)站客服 - 聯(lián)系我們

copyright@ 2023-2025  zhuangpeitu.com 裝配圖網(wǎng)版權(quán)所有   聯(lián)系電話:18123376007

備案號(hào):ICP2024067431號(hào)-1 川公網(wǎng)安備51140202000466號(hào)


本站為文檔C2C交易模式,即用戶上傳的文檔直接被用戶下載,本站只是中間服務(wù)平臺(tái),本站所有文檔下載所得的收益歸上傳人(含作者)所有。裝配圖網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)上載內(nèi)容本身不做任何修改或編輯。若文檔所含內(nèi)容侵犯了您的版權(quán)或隱私,請(qǐng)立即通知裝配圖網(wǎng),我們立即給予刪除!

五月丁香婷婷狠狠色,亚洲日韩欧美精品久久久不卡,欧美日韩国产黄片三级,手机在线观看成人国产亚洲