《數(shù)據(jù)挖掘?qū)嶒?yàn)指南part》由會員分享,可在線閱讀,更多相關(guān)《數(shù)據(jù)挖掘?qū)嶒?yàn)指南part(17頁珍藏版)》請?jiān)谘b配圖網(wǎng)上搜索。
1、,單擊此處編輯母版標(biāo)題樣式,,*,,*,單擊此處編輯母版文本樣式,,第二級,,單擊此處編輯母版標(biāo)題樣式,,單擊此處編輯母版文本樣式,,第二級,,*,,*,數(shù)據(jù)挖掘?qū)嶒?yàn)指南,,本,ppt,主要為,08,屆信科,胡旭靈,根據(jù)實(shí)驗(yàn)課內(nèi)容制作,,10,屆統(tǒng)計(jì)曠英蘭參與部分修改,特表感謝!,2024/11/28,1,數(shù)據(jù)挖掘?qū)嶒?yàn)指南,本ppt使用說明,,標(biāo)為,紅色,字體為課程涉及的主要操作,,此,ppt,主要為方便大家熟悉,weka,的基本使用,如果要深入學(xué)習(xí),可參考其他書籍,歡迎和大家一起共同學(xué)習(xí)進(jìn)步。,,軟件中提到的軟件,自帶數(shù)據(jù),,是指在軟件安裝文件夾中有個(gè),data,的文件夾里面的數(shù)據(jù)。,202
2、4/11/28,2,數(shù)據(jù)挖掘?qū)嶒?yàn)指南,總體框架,,2024/11/28,3,數(shù)據(jù)挖掘?qū)嶒?yàn)指南,Weka軟件,,Weka,軟件是著名的免費(fèi)數(shù)據(jù)挖掘軟件,各位同學(xué)可到官方網(wǎng)站下載,,共有兩種類型,一種以,jre,結(jié)尾,表示軟件自帶,java,虛擬機(jī),另一種不帶(適合,pc,上已安裝,java,虛擬機(jī))。,2024/11/28,4,數(shù)據(jù)挖掘?qū)嶒?yàn)指南,安裝運(yùn)行weka,,下載安裝包后,解壓安裝。,,注:安裝后若發(fā)現(xiàn)運(yùn)行軟件出現(xiàn)一閃而過,則說明,java,環(huán)境變量沒設(shè)置好(鑒于大家都學(xué)過,java,,設(shè)環(huán)境變量的步驟是大家應(yīng)該會的)。,,2024/11/28,5,數(shù)據(jù)挖掘?qū)嶒?yàn)指南,設(shè)置java環(huán)境變量后
3、運(yùn)行,,,2024/11/28,6,數(shù)據(jù)挖掘?qū)嶒?yàn)指南,Weka功能簡介,,Weka,介紹,,菜單欄里,program,里有個(gè)重要的,logwindow,—,日志窗口選項(xiàng)卡,用來顯示包括出錯(cuò)信息等。,,Visualization,是進(jìn)行,,數(shù)據(jù)可視化操作,,Tools,是與查看文件,,有關(guān)的功能,,2024/11/28,7,數(shù)據(jù)挖掘?qū)嶒?yàn)指南,四大主要應(yīng)用程序,,Explorer,是探索數(shù)據(jù)的環(huán)境,在本課程中將,主要介紹,。,,Experimenter,是用來運(yùn)行算法試驗(yàn),算法檢驗(yàn)等的環(huán)境。,,Knowledgefolw,這個(gè)環(huán)境與,explorer,相似,但支持拖放。,,simpleCLI,是,
4、命令行,界面,可以直接執(zhí)行,weka,命令,其實(shí)在,cmd,命令窗里也可直接運(yùn)行,weka,的命令,前提是設(shè)好環(huán)境變量等。,,,2024/11/28,8,數(shù)據(jù)挖掘?qū)嶒?yàn)指南,讀取數(shù)據(jù),,舉例:,Explorer》openfile,(,選擇本機(jī),安裝文件夾,里自帶的數(shù)據(jù),)》,選擇,weather.arff,,2024/11/28,9,數(shù)據(jù)挖掘?qū)嶒?yàn)指南,(注:,.arff,文件是,weka,識別的主要類型,,weka,還識別,spss,的,.cvs,類型,的數(shù)據(jù),故數(shù)據(jù)轉(zhuǎn)換,,為,普通數(shù)據(jù),->spss.csv->.arff,,,也可以用寫字板和記事本打開,arff,文件以觀察數(shù)據(jù)),2024/1
5、1/28,10,數(shù)據(jù)挖掘?qū)嶒?yàn)指南,Explorer的process界面簡介,,,,,,點(diǎn)擊,edit,可,修改數(shù)據(jù),,選擇屬性后點(diǎn)擊,remove,可刪除屬性,可進(jìn)行數(shù)據(jù)的變換,如離散化的數(shù)據(jù)預(yù)處理,數(shù)據(jù)預(yù)處理,的主要選項(xiàng),2024/11/28,11,數(shù)據(jù)挖掘?qū)嶒?yàn)指南,數(shù)據(jù)預(yù)處理,,數(shù)據(jù)預(yù)處理,作為數(shù)據(jù)挖掘的前奏,起著奠基石的作用,希望引起各位同學(xué)的重視。,2024/11/28,數(shù)據(jù)挖掘?qū)嶒?yàn)指南,12,數(shù)據(jù)預(yù)處理舉例:離散化,,打開,C:\Program Files\Weka-3-6\data\weather.arff,后點(diǎn)擊,choose,點(diǎn)擊,2024/11/28,13,數(shù)據(jù)挖掘?qū)嶒?yàn)指南,
6、選擇,choose,后選擇,過濾規(guī)則,:,離散化,Choose->filters->unsupervised->attribute->discretize,discretize,2024/11/28,14,數(shù)據(jù)挖掘?qū)嶒?yàn)指南,選擇規(guī)則后,應(yīng)用規(guī)則進(jìn)行離散化,1,、雙擊所選規(guī)則可進(jìn)行規(guī)則的參數(shù)設(shè)置,見右框,2,、此框可調(diào)整參數(shù),4,、點(diǎn)擊,apply,則應(yīng)用規(guī)則,3,、進(jìn)行選擇要離散化的屬性,2024/11/28,15,數(shù)據(jù)挖掘?qū)嶒?yàn)指南,離散化后的結(jié)果,,2,、應(yīng)用規(guī)則后,離散化分為,10,類,如下圖所示,1,、應(yīng)用規(guī)則后再點(diǎn)擊該屬性,可視化,2024/11/28,16,數(shù)據(jù)挖掘?qū)嶒?yàn)指南,數(shù)據(jù)預(yù)處理總結(jié),,數(shù)據(jù)預(yù)處理的方式非常多,但基本流程跟離散化差不多,請各位同學(xué)自行嘗試,多實(shí)踐。,2024/11/28,17,數(shù)據(jù)挖掘?qū)嶒?yàn)指南,