歡迎來(lái)到裝配圖網(wǎng)! | 幫助中心 裝配圖網(wǎng)zhuangpeitu.com!
裝配圖網(wǎng)
ImageVerifierCode 換一換
首頁(yè) 裝配圖網(wǎng) > 資源分類(lèi) > PPT文檔下載  

大規(guī)模稀疏矩陣并行計(jì)算

  • 資源ID:249181601       資源大?。?span id="coyq82k" class="font-tahoma">528KB        全文頁(yè)數(shù):21頁(yè)
  • 資源格式: PPT        下載積分:9.9積分
快捷下載 游客一鍵下載
會(huì)員登錄下載
微信登錄下載
三方登錄下載: 支付寶登錄   QQ登錄   微博登錄  
二維碼
微信掃一掃登錄
下載資源需要9.9積分
郵箱/手機(jī):
溫馨提示:
用戶(hù)名和密碼都是您填寫(xiě)的郵箱或者手機(jī)號(hào),方便查詢(xún)和重復(fù)下載(系統(tǒng)自動(dòng)生成)
支付方式: 微信支付   
驗(yàn)證碼:   換一換

 
賬號(hào):
密碼:
驗(yàn)證碼:   換一換
  忘記密碼?
    
友情提示
2、PDF文件下載后,可能會(huì)被瀏覽器默認(rèn)打開(kāi),此種情況可以點(diǎn)擊瀏覽器菜單,保存網(wǎng)頁(yè)到桌面,就可以正常下載了。
3、本站不支持迅雷下載,請(qǐng)使用電腦自帶的IE瀏覽器,或者360瀏覽器、谷歌瀏覽器下載即可。
4、本站資源下載后的文檔和圖紙-無(wú)水印,預(yù)覽文檔經(jīng)過(guò)壓縮,下載后原文更清晰。
5、試題試卷類(lèi)文檔,如果標(biāo)題沒(méi)有明確說(shuō)明有答案則都視為沒(méi)有答案,請(qǐng)知曉。

大規(guī)模稀疏矩陣并行計(jì)算

單擊此處編輯母版標(biāo)題樣式,單擊此處編輯母版文本樣式,第二級(jí),第三級(jí),第四級(jí),第五級(jí),*,Footer Text,*,大規(guī)模稀疏矩陣并行計(jì)算,李修宇,QQ,:,295553381,10/28/2024,1,主流求解方法,直接法,GAUSS,消去法,波前法,多波前法,迭代法,經(jīng)典迭代法,Jacobi,、,SOR,、,SSOR,投影方法,CG,、,GMRES,預(yù)處理技術(shù),不完全分解預(yù)處理?xiàng)l件,代數(shù)多重網(wǎng)格技術(shù),10/28/2024,大規(guī)模稀疏矩陣并行計(jì)算,2,矩陣性質(zhì)對(duì)求解的影響,性質(zhì),影響,10/28/2024,大規(guī)模稀疏矩陣并行計(jì)算,3,非零元的分布,帶狀分布,按塊分布,正定性,對(duì)稱(chēng)性,矩陣的存儲(chǔ)方式,求解方法的選擇,求解速度,直接法,矩陣圖重排:一般分為兩大類(lèi),帶寬縮減算法(也常稱(chēng)為外形縮減)和區(qū)域分解算法,應(yīng)用較多的帶寬縮減算法,CM,,,RCM,,,GPS,,,Rosen,算法。一般建議多重方法結(jié)合使用:全局方法的全局平衡性、局部方法的局部最優(yōu)特性。,符號(hào)分解:確定非零元結(jié)構(gòu)以及相應(yīng)的消元索引,以便在實(shí)際數(shù)值分解前確定所需存儲(chǔ)資源大小,避免數(shù)值分解中動(dòng)態(tài)分配存儲(chǔ)空間和復(fù)雜的索引策略。,構(gòu)建消去樹(shù),(elimination tree),:確定分解節(jié)點(diǎn)之間的分解依賴(lài),即確定分解的順序并構(gòu)成并行分解的層次結(jié)構(gòu)。,10/28/2024,大規(guī)模稀疏矩陣并行計(jì)算,4,直接法,數(shù)值分解:利用符號(hào)分解得到的非零元結(jié)構(gòu)和索引沿消去樹(shù)路徑進(jìn)行分解。,回代求解:包括前向(,forward,)和后向(,backward,)回代,可先構(gòu)建消去依賴(lài)樹(shù)或頂點(diǎn)著色技術(shù)實(shí)現(xiàn)并行回代求解。,在有限元領(lǐng)域應(yīng)用最廣的直接求解方法常使用帶寬縮減或多區(qū)域分解的多波前法(,multifrontal,)。,10/28/2024,大規(guī)模稀疏矩陣并行計(jì)算,5,對(duì)稱(chēng)正定矩陣的求解,10/28/2024,大規(guī)模稀疏矩陣并行計(jì)算,6,對(duì)稱(chēng)矩陣的不完全分解,10/28/2024,大規(guī)模稀疏矩陣并行計(jì)算,7,代數(shù)多重網(wǎng)格法,V-Cycle AMG,(,V,循環(huán)多重網(wǎng)格法),W-Cycle AMG,(,W,循環(huán)多重網(wǎng)格法),FMG,(完全多重網(wǎng)格法:嵌套網(wǎng)格與,V,循環(huán)或者,W,循環(huán)結(jié)合),10/28/2024,大規(guī)模稀疏矩陣并行計(jì)算,8,代數(shù)多重網(wǎng)格法,10/28/2024,大規(guī)模稀疏矩陣并行計(jì)算,9,代數(shù)多重網(wǎng)格法,在粗網(wǎng)格上對(duì)殘差方程進(jìn)行求解(可用迭代法或直接解法)。,延拓或插值(,interpolation,):將細(xì)網(wǎng)格節(jié)點(diǎn)上的值通過(guò)分片插值延拓到細(xì)網(wǎng)格節(jié)點(diǎn)上。,通過(guò)光滑的殘差對(duì)解進(jìn)行修正。,后光滑(,post-smooth,),類(lèi)似于前光滑。,10/28/2024,大規(guī)模稀疏矩陣并行計(jì)算,10,代數(shù)多重網(wǎng)格法方法選擇,對(duì)于非結(jié)構(gòu)化網(wǎng)格形成的矩陣,,SGS,,,SSOR,方法不易并行,即使使用頂點(diǎn)著色技術(shù),因其粗粒度的并行更適合于傳統(tǒng)的多核處理器,并不非常適合,GPU,這樣的細(xì)粒度并行的架構(gòu)。,Jacobi,方法不具有低通濾波性,因此推薦使用,damp-Jacobi,和,PCG,方法作為迭代子,其中,damp-Jacobi,方法的權(quán)值一般取為,2/3,。,在最粗網(wǎng)格上的計(jì)算推薦使用直接解法。,通常對(duì)于二階橢圓邊值問(wèn)題,幾何多重網(wǎng)格法具有更好的計(jì)算效率以及收斂速度。,10/28/2024,大規(guī)模稀疏矩陣并行計(jì)算,11,代數(shù)多重網(wǎng)格法方法選擇,一般遵循兩個(gè)原則:,對(duì)于某個(gè)頂點(diǎn),其鄰接頂點(diǎn)要么屬于粗網(wǎng)格頂點(diǎn),要么至少連接到一個(gè)粗網(wǎng)格頂點(diǎn)。,粗網(wǎng)格頂點(diǎn)集應(yīng)是任意兩個(gè)粗網(wǎng)格節(jié)點(diǎn)不相鄰的極大獨(dú)立集。,有時(shí)很難同時(shí)滿(mǎn)足兩個(gè)條件,優(yōu)先滿(mǎn)足第一個(gè)條件時(shí)盡量滿(mǎn)足第二個(gè)條件。,10/28/2024,大規(guī)模稀疏矩陣并行計(jì)算,12,代數(shù)多重網(wǎng)格法方法選擇,10/28/2024,大規(guī)模稀疏矩陣并行計(jì)算,13,代數(shù)多重網(wǎng)格法的局限性,任意幾何網(wǎng)格不適用于所有問(wèn)題。,需要高質(zhì)量的網(wǎng)格劃分。,不便于編寫(xiě)通用的程序。,重點(diǎn)要解決的問(wèn)題:網(wǎng)格粗化(對(duì)應(yīng)于粗水平方程組)。,常用的網(wǎng)格粗化方法復(fù)雜:,RS,,,RS2,,,RS3,,,Falgout,,,HIPS,,,CLJP,。,10/28/2024,大規(guī)模稀疏矩陣并行計(jì)算,14,大規(guī)模稀疏矩陣,GPU,計(jì)算程序優(yōu)化設(shè)計(jì)探索,內(nèi)核執(zhí)行的優(yōu)化,在大循環(huán)中具有大量入口參數(shù)的內(nèi)核,其不變的參數(shù)在循環(huán)開(kāi)始前放入常量?jī)?nèi)存。避免多余的內(nèi)存操作,合理的網(wǎng)格布局。,有時(shí)將一個(gè)大,grid,拆分成多個(gè)階段小的,grid,將有助于提高網(wǎng)格利用率,提高計(jì)算效率,例如對(duì)稱(chēng)矩陣的分解以及三角方程組的計(jì)算。,寄存器優(yōu)化,一個(gè)線(xiàn)程中計(jì)算輸出多個(gè)變量,用寄存器內(nèi)存替換共享內(nèi)存。,在,Fermi,上,如果程序中存取操作占多數(shù),則對(duì)于大于,32bit,的數(shù)據(jù),以字節(jié)流的形式訪問(wèn),因?yàn)閷?duì)于例如雙精度數(shù)據(jù),這時(shí)只有一個(gè),warp,調(diào)度器可以工作。,10/28/2024,大規(guī)模稀疏矩陣并行計(jì)算,15,大規(guī)模稀疏矩陣,GPU,計(jì)算程序優(yōu)化設(shè)計(jì)探索,合并訪問(wèn),存取操作以,half-warp,(計(jì)算能力,b),a=c;,else,a=0;,可以替換為:,a=(ab)*c;,10/28/2024,大規(guī)模稀疏矩陣并行計(jì)算,17,大規(guī)模稀疏矩陣,GPU,計(jì)算程序優(yōu)化設(shè)計(jì)探索,指令按照,half-warp,(計(jì)算能力,=1.3,)或者,warp,對(duì)齊。例如:每個(gè)線(xiàn)程計(jì)算輸出,7,個(gè)變量,每個(gè)變量的計(jì)算差別很大。這時(shí)可以讓,block,的第一個(gè),warp,的所有線(xiàn)程計(jì)算第一個(gè)變量,第二個(gè),warp,計(jì)算第二個(gè)變量,,可以利用函數(shù)指針(在計(jì)算能力,=1.3,的硬件上可以使用對(duì)齊到,warp,邊界的控制語(yǔ)句,這時(shí)并不會(huì)在,warp,內(nèi)造成路徑分支(,uniform divergence,),通過(guò),warp,編號(hào)來(lái)選擇;但是對(duì)于相近的計(jì)算則不建議使用函數(shù)指針?lè)炊鴷?huì)降低效率。,10/28/2024,Footer Text,18,大規(guī)模稀疏矩陣,GPU,計(jì)算程序優(yōu)化設(shè)計(jì)探索,對(duì)于矢量類(lèi)型數(shù)據(jù),使用,SOA,(,Structure of Array,)格式代替,例如,,float4,可使用,xxxx yyyy zzzz wwww,的存儲(chǔ)結(jié)構(gòu)代替,一般更有效。,在,Fermi,硬件上,讀,float4,類(lèi)型的數(shù)據(jù),雖然顯存帶寬可以被充分利用,但是會(huì)有部分,CUDA Core,暫時(shí)閑置,并且必須等待兩次的存儲(chǔ)請(qǐng)求完成才開(kāi)始計(jì)算,而如果使用,SOA,,則在其后的各分量獨(dú)立的計(jì)算中可以更有效隱藏延遲。,10/28/2024,大規(guī)模稀疏矩陣并行計(jì)算,19,大規(guī)模稀疏矩陣,GPU,計(jì)算程序優(yōu)化設(shè)計(jì)探索,如果按照顯式的,warp,模式進(jìn)行操作,則盡量將每個(gè),warp,對(duì)應(yīng)操作的存儲(chǔ)器起始地址對(duì)齊。如果每個(gè),warp,的活動(dòng)線(xiàn)程數(shù)小于,75%,左右時(shí),則不建議使用。,數(shù)據(jù)結(jié)構(gòu)應(yīng)該和網(wǎng)格布局相互適應(yīng)來(lái)有效利用存儲(chǔ)控制器的帶寬。例如矩陣的轉(zhuǎn)置。,10/28/2024,大規(guī)模稀疏矩陣并行計(jì)算,20,謝謝!,10/28/2024,21,大規(guī)模稀疏矩陣并行計(jì)算,

注意事項(xiàng)

本文(大規(guī)模稀疏矩陣并行計(jì)算)為本站會(huì)員(tia****g98)主動(dòng)上傳,裝配圖網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)上載內(nèi)容本身不做任何修改或編輯。 若此文所含內(nèi)容侵犯了您的版權(quán)或隱私,請(qǐng)立即通知裝配圖網(wǎng)(點(diǎn)擊聯(lián)系客服),我們立即給予刪除!

溫馨提示:如果因?yàn)榫W(wǎng)速或其他原因下載失敗請(qǐng)重新下載,重復(fù)下載不扣分。




關(guān)于我們 - 網(wǎng)站聲明 - 網(wǎng)站地圖 - 資源地圖 - 友情鏈接 - 網(wǎng)站客服 - 聯(lián)系我們

copyright@ 2023-2025  zhuangpeitu.com 裝配圖網(wǎng)版權(quán)所有   聯(lián)系電話(huà):18123376007

備案號(hào):ICP2024067431號(hào)-1 川公網(wǎng)安備51140202000466號(hào)


本站為文檔C2C交易模式,即用戶(hù)上傳的文檔直接被用戶(hù)下載,本站只是中間服務(wù)平臺(tái),本站所有文檔下載所得的收益歸上傳人(含作者)所有。裝配圖網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)上載內(nèi)容本身不做任何修改或編輯。若文檔所含內(nèi)容侵犯了您的版權(quán)或隱私,請(qǐng)立即通知裝配圖網(wǎng),我們立即給予刪除!

五月丁香婷婷狠狠色,亚洲日韩欧美精品久久久不卡,欧美日韩国产黄片三级,手机在线观看成人国产亚洲