數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘考試試題.doc
《數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘考試試題.doc》由會(huì)員分享,可在線閱讀,更多相關(guān)《數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘考試試題.doc(4頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
一、 填空題(15分) 1.數(shù)據(jù)倉(cāng)庫(kù)的特點(diǎn)分別是 面向主題 、 集成 、 相對(duì)穩(wěn)定 、反映歷史變化。 2.元數(shù)據(jù)是描述數(shù)據(jù)倉(cāng)庫(kù)內(nèi)數(shù)據(jù)的結(jié)構(gòu)和建立方法的數(shù)據(jù)。根據(jù)元數(shù)據(jù)用途的不同可將元數(shù)據(jù)分為 技術(shù) 元數(shù)據(jù)和 業(yè)務(wù) 元數(shù)據(jù)兩類。 3.OLAP技術(shù)多維分析過(guò)程中,多維分析操作包括 切片 、 切塊 、 鉆取 、 旋轉(zhuǎn) 等。 4.基于依賴型數(shù)據(jù)集市和操作型數(shù)據(jù)存儲(chǔ)的數(shù)據(jù)倉(cāng)庫(kù)體系結(jié)構(gòu)常常被稱為“ 中心和輻射 ”架構(gòu),其中 企業(yè)級(jí)數(shù)據(jù)倉(cāng)庫(kù) 是中心,源數(shù)據(jù)系統(tǒng)和數(shù)據(jù)集市在輸入和輸出范圍的兩端。 5.ODS實(shí)際上是一個(gè)集成的、 面向主題的 、 可更新的 、 當(dāng)前值的 、 企業(yè)級(jí)的 、詳細(xì)的數(shù)據(jù)庫(kù),也叫運(yùn)營(yíng)數(shù)據(jù)存儲(chǔ)。 二、 多項(xiàng)選擇題(10分) 6.在數(shù)據(jù)挖掘的分析方法中,直接數(shù)據(jù)挖掘包括( ACD ) A 分類 B 關(guān)聯(lián) C 估值 D 預(yù)言 7.數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)ETL過(guò)程中,ETL軟件的主要功能包括(ABC) A 數(shù)據(jù)抽取 B 數(shù)據(jù)轉(zhuǎn)換 C 數(shù)據(jù)加載 D 數(shù)據(jù)稽核 8.數(shù)據(jù)分類的評(píng)價(jià)準(zhǔn)則包括( ABCD ) A 精確度 B 查全率和查準(zhǔn)率 C F-Measure D 幾何均值 9.層次聚類方法包括( BC ) A 劃分聚類方法 B 凝聚型層次聚類方法 C 分解型層次聚類方法 D 基于密度聚類方法 10.貝葉斯網(wǎng)絡(luò)由兩部分組成,分別是( A D ) A 網(wǎng)絡(luò)結(jié)構(gòu) B 先驗(yàn)概率 C 后驗(yàn)概率 D 條件概率表 三、 計(jì)算題(30分) 11.一個(gè)食品連鎖店每周的事務(wù)記錄如下表所示,其中每一條事務(wù)表示在一項(xiàng)收款機(jī)業(yè)務(wù)中賣出的項(xiàng)目,假定supmin=40%,confmin=40%,使用Apriori算法計(jì)算生成的關(guān)聯(lián)規(guī)則,標(biāo)明每趟數(shù)據(jù)庫(kù)掃描時(shí)的候選集和大項(xiàng)目集。(15分) 事務(wù) 項(xiàng)目 事務(wù) 項(xiàng)目 T1 T2 T3 面包、果凍、花生醬 面包、花生醬 面包、牛奶、花生醬 T4 T5 啤酒、面包 啤酒、牛奶 解:(1)由I={面包、果凍、花生醬、牛奶、啤酒}的所有項(xiàng)目直接產(chǎn)生1-候選C1,計(jì)算其支持度,取出支持度小于supmin的項(xiàng)集,形成1-頻繁集L1,如下表所示: 項(xiàng)集C1 支持度 項(xiàng)集L1 支持度 {面包} {花生醬} {牛奶} {啤酒} 4/5 3/5 2/5 2/5 {面包} {花生醬} {牛奶} {啤酒} 4/5 3/5 2/5 2/5 (2)組合連接L1中的各項(xiàng)目,產(chǎn)生2-候選集C2,計(jì)算其支持度,取出支持度小于supmin的項(xiàng)集,形成2-頻繁集L2,如下表所示: 項(xiàng)集C2 支持度 項(xiàng)集L2 支持度 {面包、花生醬} 3/5 {面包、花生醬} 3/5 至此,所有頻繁集都被找到,算法結(jié)束, 所以,confidence({面包}→{花生醬})=(4/5)/(3/5)=4/3> confmin confidence({ 花生醬}→{面包})=(3/5)/(4/5)=3/4> confmin 所以,關(guān)聯(lián)規(guī)則{面包}→{花生醬}、{ 花生醬}→{面包}均是強(qiáng)關(guān)聯(lián)規(guī)則。 12.給定以下數(shù)據(jù)集(2,4,10,12,15,3,21),進(jìn)行K-Means聚類,設(shè)定聚類數(shù)為2個(gè),相似度按照歐式距離計(jì)算。(15分) 解:(1)從數(shù)據(jù)集X中隨機(jī)地選擇k個(gè)數(shù)據(jù)樣本作為聚類的出示代表點(diǎn),每一個(gè)代表點(diǎn)表示一個(gè)類別,由題可知k=2,則可設(shè)m1=2,m2=4: (2)對(duì)于X中的任意數(shù)據(jù)樣本xm(1- 1.請(qǐng)仔細(xì)閱讀文檔,確保文檔完整性,對(duì)于不預(yù)覽、不比對(duì)內(nèi)容而直接下載帶來(lái)的問(wèn)題本站不予受理。
- 2.下載的文檔,不會(huì)出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請(qǐng)點(diǎn)此認(rèn)領(lǐng)!既往收益都?xì)w您。
下載文檔到電腦,查找使用更方便
9.9 積分
下載 |
- 配套講稿:
如PPT文件的首頁(yè)顯示word圖標(biāo),表示該P(yáng)PT已包含配套word講稿。雙擊word圖標(biāo)可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國(guó)旗、國(guó)徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計(jì)者僅對(duì)作品中獨(dú)創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 數(shù)據(jù)倉(cāng)庫(kù) 數(shù)據(jù) 挖掘 考試 試題
鏈接地址:http://m.jqnhouse.com/p-6622227.html