數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘1實(shí)驗(yàn)報(bào)告冊(cè)汽院科院.doc
《數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘1實(shí)驗(yàn)報(bào)告冊(cè)汽院科院.doc》由會(huì)員分享,可在線閱讀,更多相關(guān)《數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘1實(shí)驗(yàn)報(bào)告冊(cè)汽院科院.doc(9頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
《數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘》 實(shí)驗(yàn)報(bào)告冊(cè) 20 - 20 學(xué)年 第 學(xué)期 班 級(jí): 學(xué) 號(hào): 姓 名: 目錄 實(shí)驗(yàn)一 Microsoft SQL Server Analysis Services的使用 3 實(shí)驗(yàn)二 使用WEKA進(jìn)行分類與預(yù)測(cè) 5 實(shí)驗(yàn)三 使用WEKA進(jìn)行關(guān)聯(lián)規(guī)則與聚類分析 6 實(shí)驗(yàn)四 數(shù)據(jù)挖掘算法的程序?qū)崿F(xiàn) 7 實(shí)驗(yàn)一 Microsoft SQL Server Analysis Services的使用 實(shí)驗(yàn)類型:驗(yàn)證性 實(shí)驗(yàn)學(xué)時(shí):4 實(shí)驗(yàn)?zāi)康模? 學(xué)習(xí)并掌握Analysis Services的操作,加深理解數(shù)據(jù)倉(cāng)庫(kù)中涉及的一些概念,如多維數(shù)據(jù)集,事實(shí)表,維表,星型模型,雪花模型,聯(lián)機(jī)分析處理等。 實(shí)驗(yàn)內(nèi)容: 在實(shí)驗(yàn)之前,先通讀自學(xué)SQL SERVER自帶的Analysis Manager概念與教程。按照自學(xué)教程的步驟,完成對(duì)FoodMart數(shù)據(jù)源的聯(lián)機(jī)分析。建立、編輯多維數(shù)據(jù)集,進(jìn)行OLAP操作,看懂OLAP的分析數(shù)據(jù)。 實(shí)驗(yàn)步驟: 1、 啟動(dòng)聯(lián)機(jī)分析管理器: 2、 建立系統(tǒng)數(shù)據(jù)源連接。 3、 建立數(shù)據(jù)庫(kù)和數(shù)據(jù)源,多維數(shù)據(jù)集 編輯多維數(shù)據(jù)集 4、 設(shè)計(jì)存儲(chǔ)和處理多維數(shù)據(jù)集 5、 瀏覽多維數(shù)據(jù)集中的數(shù)據(jù) 按時(shí)間篩選數(shù)據(jù) 實(shí)驗(yàn)小結(jié): 實(shí)驗(yàn)二 使用WEKA進(jìn)行分類與預(yù)測(cè) 實(shí)驗(yàn)類型:綜合性 實(shí)驗(yàn)學(xué)時(shí):4 實(shí)驗(yàn)?zāi)康模? 掌握數(shù)據(jù)挖掘平臺(tái)WEKA的使用。綜合運(yùn)用數(shù)據(jù)預(yù)處理、分類與預(yù)測(cè)的挖掘算法、結(jié)果的解釋等知識(shí)進(jìn)行數(shù)據(jù)挖掘。從而加深理解課程中的相關(guān)知識(shí)點(diǎn)。 實(shí)驗(yàn)內(nèi)容: 閱讀并理解WEKA的相關(guān)中英文資料,熟悉數(shù)據(jù)挖掘平臺(tái)WEKA,針對(duì)實(shí)際數(shù)據(jù),能夠使用WEKA進(jìn)行數(shù)據(jù)的預(yù)處理,能選擇合適的分類與預(yù)測(cè)算法對(duì)數(shù)據(jù)進(jìn)行分析,并能解釋分析結(jié)果。 實(shí)驗(yàn)步驟: 1、在開(kāi)始->程序->啟動(dòng)WEKA,進(jìn)入Explorer界面,熟悉WEKA的界面功能。 2、選擇數(shù)據(jù)集(實(shí)驗(yàn)中的數(shù)據(jù)可以從網(wǎng)絡(luò)獲取),如泰坦尼克號(hào)數(shù)據(jù)集,將要處理的數(shù)據(jù)集轉(zhuǎn)換成WEKA能處理的格式,如 .ARFF格式。思考:如何將其它格式的數(shù)據(jù)文件(如.XLS)轉(zhuǎn)換為.ARFF格式? 3、根據(jù)選擇的數(shù)據(jù)挖掘算法,如果有必要,在Weka Explorer界面,Preprocess選項(xiàng)中,進(jìn)行相應(yīng)的數(shù)據(jù)預(yù)處理。要求:熟悉Preprocess界面中各個(gè)功能選項(xiàng)的含義,理解數(shù)據(jù)的特征。思考:在filter中,supervised和unsupervised的區(qū)別? 4、在Weka Explorer界面,單擊Visualize選項(xiàng),進(jìn)入WEKA 的可視化頁(yè)面,可以對(duì)當(dāng)前的關(guān)系作二維散點(diǎn)圖式的可視化瀏覽。要求: 熟悉Visualize界面中各個(gè)功能選項(xiàng)的含義,理解可視化圖形的意義。 5、選擇相應(yīng)的分類與預(yù)測(cè)挖掘算法對(duì)數(shù)據(jù)集進(jìn)行分析,進(jìn)行算法參數(shù)的具體設(shè)置。如利用WEKA->Classifier->trees->J48 決策樹(shù)算法,對(duì)泰坦尼克號(hào)數(shù)據(jù)集進(jìn)行分析;如利用回歸模型對(duì)連續(xù)數(shù)值進(jìn)行預(yù)測(cè)。要求:對(duì)你選擇的分類和預(yù)測(cè)算法思想分別進(jìn)行介紹,熟悉classify界面的內(nèi)容,對(duì)classifier中的參數(shù)含義分別進(jìn)行介紹。思考:classifier->trees->J48算法與classifier->trees->id3算法的區(qū)別與聯(lián)系。 6、對(duì)分析所獲得的結(jié)果進(jìn)行解釋。如,根據(jù)決策樹(shù)和分類規(guī)則嘗試討論泰坦尼克號(hào)幸存者的特征。理解評(píng)估分類和預(yù)測(cè)優(yōu)劣的一些準(zhǔn)則。 實(shí)驗(yàn)小結(jié): 實(shí)驗(yàn)中遇到的問(wèn)題及解決辦法、心得、體會(huì)等等... 思考題 給出數(shù)據(jù)挖掘中分類與預(yù)測(cè)成功應(yīng)用的案例,并簡(jiǎn)要介紹。 實(shí)驗(yàn)三 使用WEKA進(jìn)行關(guān)聯(lián)規(guī)則與聚類分析 實(shí)驗(yàn)類型:綜合性 實(shí)驗(yàn)學(xué)時(shí):4 實(shí)驗(yàn)?zāi)康模? 掌握數(shù)據(jù)挖掘平臺(tái)WEKA的使用。綜合運(yùn)用數(shù)據(jù)預(yù)處理、關(guān)聯(lián)規(guī)則與聚類的挖掘算法、結(jié)果的解釋等知識(shí)進(jìn)行數(shù)據(jù)挖掘。從而加深理解課程中的相關(guān)知識(shí)點(diǎn)。 實(shí)驗(yàn)內(nèi)容: 閱讀并理解WEKA的相關(guān)中英文資料,熟悉數(shù)據(jù)挖掘平臺(tái)WEKA,針對(duì)實(shí)際數(shù)據(jù),能夠使用WEKA進(jìn)行數(shù)據(jù)的預(yù)處理,了解屬性選擇,能選擇合適的關(guān)聯(lián)規(guī)則與聚類算法對(duì)數(shù)據(jù)進(jìn)行分析,并能解釋分析結(jié)果。 實(shí)驗(yàn)步驟: 1、在開(kāi)始->程序->啟動(dòng)WEKA,進(jìn)入Explorer界面,熟悉WEKA的界面功能。 2、選擇數(shù)據(jù)集(實(shí)驗(yàn)中的數(shù)據(jù)可以從網(wǎng)絡(luò)獲?。?,將要處理的數(shù)據(jù)集轉(zhuǎn)換成WEKA能處理的格式,如 .ARFF格式。根據(jù)選擇的數(shù)據(jù)挖掘算法,如果有必要,在Weka Explorer界面,Preprocess選項(xiàng)中,進(jìn)行相應(yīng)的數(shù)據(jù)預(yù)處理。 3、在Weka Explorer界面,單擊Select attributes選項(xiàng),進(jìn)入WEKA 的屬性選擇頁(yè)面。要求: 了解該界面中主要功能選項(xiàng)的含義,理解該界面的功能。 5、在Weka Explorer界面,單擊Associate選項(xiàng),進(jìn)入WEKA 的關(guān)聯(lián)規(guī)則頁(yè)面。選擇一個(gè)關(guān)聯(lián)規(guī)則算法對(duì)數(shù)據(jù)集進(jìn)行分析,進(jìn)行算法參數(shù)的具體設(shè)置。要求:對(duì)你選擇的關(guān)聯(lián)規(guī)則算法思想進(jìn)行介紹,熟悉Associate界面的內(nèi)容,對(duì)Associate中的參數(shù)含義分別進(jìn)行介紹。理解用來(lái)衡量規(guī)則的關(guān)聯(lián)程度的幾個(gè)度量指標(biāo)。理解并解釋分析所獲得的結(jié)果。 6、在Weka Explorer界面,單擊Cluster選項(xiàng),進(jìn)入WEKA 的聚類頁(yè)面。選擇一個(gè)聚類算法(如K均值)對(duì)數(shù)據(jù)集進(jìn)行分析,進(jìn)行算法參數(shù)的具體設(shè)置。要求:對(duì)你選擇的聚類算法思想進(jìn)行介紹,熟悉Cluster界面的內(nèi)容,對(duì)Cluster中的參數(shù)含義進(jìn)行介紹。理解并解釋分析所獲得的結(jié)果。 實(shí)驗(yàn)小結(jié): 實(shí)驗(yàn)中遇到的問(wèn)題及解決辦法、心得、體會(huì)等等... 思考題 給出數(shù)據(jù)挖掘中關(guān)聯(lián)規(guī)則與聚類成功應(yīng)用的一些案例,并簡(jiǎn)要介紹。 實(shí)驗(yàn)四 數(shù)據(jù)挖掘算法的程序?qū)崿F(xiàn) 實(shí)驗(yàn)類型:設(shè)計(jì)性 實(shí)驗(yàn)學(xué)時(shí):4 實(shí)驗(yàn)?zāi)康模? 運(yùn)用數(shù)據(jù)挖掘、程序設(shè)計(jì)等相關(guān)知識(shí),選擇一個(gè)數(shù)據(jù)挖掘的常用算法進(jìn)行程序設(shè)計(jì)實(shí)現(xiàn)。加深對(duì)數(shù)據(jù)挖掘算法基本原理、詳細(xì)執(zhí)行過(guò)程和具體應(yīng)用情況的理解。 實(shí)驗(yàn)內(nèi)容: 采用任何一種自己熟悉的編程語(yǔ)言,完成算法的程序設(shè)計(jì),并在每個(gè)程序設(shè)計(jì)語(yǔ)句后面進(jìn)行詳細(xì)的注釋。能夠運(yùn)用實(shí)現(xiàn)的算法來(lái)解決某個(gè)具體的問(wèn)題,得到并解釋程序運(yùn)行的結(jié)果。 推薦的算法: 1 關(guān)聯(lián)規(guī)則:Apriori算法 2 分類與預(yù)測(cè):ID3, C4.5, KNN, BP, 3 聚類:k-means 實(shí)驗(yàn)步驟: 1. 提前預(yù)習(xí),選擇算法,理解原理。 2. 針對(duì)具體問(wèn)題,選擇熟悉的編程平臺(tái),進(jìn)行算法的程序?qū)崿F(xiàn),盡量在每個(gè)程序語(yǔ)句后面進(jìn)行詳細(xì)注釋。 3. 自己選擇某個(gè)數(shù)據(jù)集,應(yīng)用實(shí)現(xiàn)的算法得到結(jié)果并解釋。 實(shí)驗(yàn)小結(jié): 實(shí)驗(yàn)中遇到的問(wèn)題及解決辦法、心得、體會(huì)等等...- 1.請(qǐng)仔細(xì)閱讀文檔,確保文檔完整性,對(duì)于不預(yù)覽、不比對(duì)內(nèi)容而直接下載帶來(lái)的問(wèn)題本站不予受理。
- 2.下載的文檔,不會(huì)出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請(qǐng)點(diǎn)此認(rèn)領(lǐng)!既往收益都?xì)w您。
下載文檔到電腦,查找使用更方便
9.9 積分
下載 |
- 配套講稿:
如PPT文件的首頁(yè)顯示word圖標(biāo),表示該P(yáng)PT已包含配套word講稿。雙擊word圖標(biāo)可打開(kāi)word文檔。
- 特殊限制:
部分文檔作品中含有的國(guó)旗、國(guó)徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計(jì)者僅對(duì)作品中獨(dú)創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 數(shù)據(jù)倉(cāng)庫(kù) 數(shù)據(jù) 挖掘 實(shí)驗(yàn) 報(bào)告 冊(cè)汽院科院
鏈接地址:http://m.jqnhouse.com/p-6567421.html