暨南大學(xué)并行計算實驗室MapReduce研究現(xiàn)狀

上傳人:huo****ian 文檔編號:248368784 上傳時間:2024-10-23 格式:PPT 頁數(shù):18 大?。?56KB
收藏 版權(quán)申訴 舉報 下載
暨南大學(xué)并行計算實驗室MapReduce研究現(xiàn)狀_第1頁
第1頁 / 共18頁
暨南大學(xué)并行計算實驗室MapReduce研究現(xiàn)狀_第2頁
第2頁 / 共18頁
暨南大學(xué)并行計算實驗室MapReduce研究現(xiàn)狀_第3頁
第3頁 / 共18頁

下載文檔到電腦,查找使用更方便

9.9 積分

下載資源

還剩頁未讀,繼續(xù)閱讀

資源描述:

《暨南大學(xué)并行計算實驗室MapReduce研究現(xiàn)狀》由會員分享,可在線閱讀,更多相關(guān)《暨南大學(xué)并行計算實驗室MapReduce研究現(xiàn)狀(18頁珍藏版)》請在裝配圖網(wǎng)上搜索。

1、*,Click to edit the title text format,Click to edit the outline text format,Second Outline Level,Third Outline Level,Fourth Outline Level,Fifth Outline Level,Sixth Outline Level,Seventh Outline Level,Eighth Outline Level,Ninth Outline Level,*,Click to edit the title text format,Click to edit the out

2、line text format,Second Outline Level,Third Outline Level,Fourth Outline Level,Fifth Outline Level,Sixth Outline Level,Seventh Outline Level,Eighth Outline Level,Ninth Outline Level,暨南大學(xué)并行計算實驗室,MapReduce,研究現(xiàn)狀,專 業(yè):計算機(jī)軟件與理論,姓 名:周敏 丁光華,指導(dǎo)教師:周繼鵬 教授,摘要,MapReduce,研究,調(diào)試、監(jiān)控等,優(yōu)化、擴(kuò)展等,常用,API,Hadoop,改造,數(shù)據(jù)挖掘項目,R

3、edpoll,Canopy,k-means,Naive bayes,SVM,調(diào)試,標(biāo)準(zhǔn)輸出,標(biāo)準(zhǔn)出錯,Web,顯示,(50030,50060,50070),NameNode,JobTracker,DataNode,TaskTracker,日志,本地重現(xiàn),:Local Runner,DistributedCache,中放入調(diào)試代碼,Profiling,目的:查性能瓶頸,內(nèi)存泄漏,線程死鎖等,工具:,jmap,jstat,hprof,jconsole,jprofiler mat,jstack,對,JobTracker,的,Profile,對各,slave,節(jié)點,TaskTracker,的,Prof

4、ile,對各,slave,節(jié)點某,Child,進(jìn)程的,Profile(,可能存在單點執(zhí)行速度過慢,),監(jiān)控,目的:監(jiān)控集群或單個節(jié)點,I/O,內(nèi)存及,CPU,工具:,Ganglia,調(diào)優(yōu)點,(1),I/O,Shuffle,調(diào)優(yōu)點,(2),數(shù)據(jù)壓縮,推測,性執(zhí)行,(,同時執(zhí)行同一,Task,殺死運行慢的,),同一節(jié)點的,Child,重用,jvm,重寫,Partitioner,使分布到各,Reducer,的數(shù)據(jù)均勻,設(shè)置堆空間大小,常用,API,Mapper,Reducer,Writable,ComparableWritable,InputFormat,OutputFormat,Partition

5、er,Comparator,DistributedCache,Streaming(bash/python),Hadoop,改造,JobTracker,與作業(yè)調(diào)度耦合性太強(qiáng),JobHistory,應(yīng)獨立為一個,jvm,進(jìn)程,邏輯不應(yīng)與,JobTracker,耦合太強(qiáng),在,HDFS,之上整合,MPI,統(tǒng)一作業(yè)調(diào)度,Shuffle,過程只需一次,I/O,單塊磁盤失效導(dǎo)致整個節(jié)點失效問題,(,改,DFSClient),Hadoop,改造,文件系統(tǒng)兼容,posix,使,Map,的,key,輸出不排序,只分區(qū),NameNode,單點故障問題,RPC,支持大數(shù)據(jù),(,如文件,),傳輸,集群資源分配,權(quán)限管理

6、,大規(guī)模數(shù)據(jù)挖掘,:Redpoll,文本數(shù)據(jù)挖掘,分布式分詞,分布式向量空間模型,距離度量,語料,搜狗新聞,20 news group,wikipedia,前提:,假定一個屬性值對分類的影響?yīng)毩⒂谄渌麑傩缘闹?。(類條件獨立),樸素貝葉斯分類工作過程,每個數(shù)據(jù)樣本用一個,n,維特征向量 表示,分別描述對,n,個屬性 樣本的,n,個度量,假設(shè)有,m,個類 。給定一個未知的數(shù)據(jù)樣本,X,,分類法將預(yù)測具有最高后驗概率(條件,X,下)的類。即是找最大化的 。根據(jù)貝葉斯定理有,樸素貝葉斯分類,P(X),對所有類為常數(shù),最大化 ,對 的考慮分析:等概率,或,類條件獨立的樸素假定:,,(,k=1,,,2,,

7、,n,)可以由訓(xùn)練樣本估值,是分類屬性,則根據(jù)樣本估值,是連續(xù)值屬性,則通常假定其服從高斯分布,因而,樸素貝葉斯分類,(,續(xù),),Canopy,大容量,高維數(shù)據(jù)集聚類,使用兩步聚類,不同的距離度量,節(jié)省計算時間,適用范圍較廣,K-means,EM,GAC,大規(guī)模支持向量機(jī),解的稀疏性及問題的凸性,將大規(guī)模的原問題分解成小規(guī)模的子問題,迭代求解子問題,直到收斂至原問題的解,.,選塊算法,分解算法,序列最小最優(yōu)化法,(sequential minimal optimization,SMO),并行實現(xiàn),Thinking in MapReduce,B,A,D,A,A,C,B,C,B,C,D,Group,Co-group,Function,Stream Flow,Filter,Filter,Aggregate,謝謝,!,

展開閱讀全文
溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

相關(guān)資源

更多
正為您匹配相似的精品文檔
關(guān)于我們 - 網(wǎng)站聲明 - 網(wǎng)站地圖 - 資源地圖 - 友情鏈接 - 網(wǎng)站客服 - 聯(lián)系我們

copyright@ 2023-2025  zhuangpeitu.com 裝配圖網(wǎng)版權(quán)所有   聯(lián)系電話:18123376007

備案號:ICP2024067431-1 川公網(wǎng)安備51140202000466號


本站為文檔C2C交易模式,即用戶上傳的文檔直接被用戶下載,本站只是中間服務(wù)平臺,本站所有文檔下載所得的收益歸上傳人(含作者)所有。裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對上載內(nèi)容本身不做任何修改或編輯。若文檔所含內(nèi)容侵犯了您的版權(quán)或隱私,請立即通知裝配圖網(wǎng),我們立即給予刪除!

五月丁香婷婷狠狠色,亚洲日韩欧美精品久久久不卡,欧美日韩国产黄片三级,手机在线观看成人国产亚洲