《投影片1Webcastingppt課件》由會(huì)員分享,可在線閱讀,更多相關(guān)《投影片1Webcastingppt課件(22頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
1、,按一下以編輯母片標(biāo)題樣式,按一下以編輯母片,第二層,第三層,第四層,第五層,*,金融與製造業(yè)應(yīng)用案例研討,謝邦昌,輔仁大學(xué)統(tǒng)計(jì)資訊學(xué)系 教授中華資料採(cǎi)礦協(xié)會(huì) 理事長(zhǎng),輔仁大學(xué) Data Mining 專(zhuān)題研究團(tuán)隊(duì),金融與製造業(yè)應(yīng)用案例研討謝邦昌,1,知識(shí)發(fā)現(xiàn)與資料採(cǎi)礦-,CRISP-DM,資料採(cǎi)礦步驟,Data,Business Understanding,Data Understanding,Data Preparation,Modeling,Evaluation,Deployment,知識(shí)發(fā)現(xiàn)與資料採(cǎi)礦-CRISP-DM資料採(cǎi)礦步驟DataBu,2,資料採(cǎi)礦功能,分類(lèi):主觀分類(lèi),推估:透
2、過(guò)信用卡張數(shù)及每月薪水推估其每月信用卡消費(fèi)金額,預(yù)測(cè):股價(jià)預(yù)測(cè),關(guān)聯(lián)分組:產(chǎn)品組合促銷(xiāo),集群化:客觀分群,資料採(cǎi)礦功能分類(lèi):主觀分類(lèi),3,資料採(cǎi)礦方法,群集分析是一種劃分方法,目的在將一些事物歸併在一起,利用群體中各事物都具有相同的特性,而在群體與群體之間卻有顯著的差異。,決策樹(shù)是從一個(gè)或多個(gè)預(yù)測(cè)變數(shù)中,針對(duì)類(lèi)別應(yīng)變數(shù)的階級(jí),預(yù)測(cè)案例或物件的關(guān)係;分類(lèi)樹(shù)的目標(biāo)是針對(duì)類(lèi)別應(yīng)變數(shù)加以預(yù)測(cè)或解釋反應(yīng)結(jié)果。,資料採(cǎi)礦方法群集分析是一種劃分方法,目的在將一些事物歸併在一,4,建構(gòu)銀行業(yè)信用卡顧客區(qū)隔之資料採(cǎi)礦架構(gòu),建構(gòu)銀行業(yè)信用卡顧客區(qū)隔之資料採(cǎi)礦架構(gòu),5,研究動(dòng)機(jī),高度競(jìng)爭(zhēng)使得各發(fā)卡銀行對(duì)於審核信用卡
3、申請(qǐng)者之限制趨於寬鬆,而授信的品質(zhì)漸漸下滑,導(dǎo)致,催收帳款增加,,,呆帳日漸累積,,銀行需花大量成本和人力去處理這些壞帳反而得不償失。,掌握資料採(cǎi)礦針對(duì)通過(guò)給予發(fā)卡的客戶加以分類(lèi)管理,以彌補(bǔ)不良的受信制度以及降低其風(fēng)險(xiǎn)。,研究動(dòng)機(jī)高度競(jìng)爭(zhēng)使得各發(fā)卡銀行對(duì)於審核信用卡申請(qǐng)者之限制趨於,6,研究架構(gòu),資料採(cǎi)礦架構(gòu),問(wèn)題定義與架構(gòu),結(jié)果解釋與評(píng)估,建立採(cǎi)礦模式,資料準(zhǔn)備,驗(yàn)證,信用卡資料DB,研究架構(gòu)資料採(cǎi)礦架構(gòu)問(wèn)題定義與架構(gòu)結(jié)果解釋與評(píng)估建立採(cǎi)礦模式,7,建立資料採(cǎi)礦模式,群集分析建立顧客分群,透過(guò)顧客特性資料,建立不同分群,各群中,顧客特質(zhì)具有高度同質(zhì)性,群集,建立資料採(cǎi)礦模式群集分析建立顧客分
4、群群集,8,建立資料採(cǎi)礦模式,決策樹(shù)分析建立顧客特性分類(lèi),利用層級(jí)架構(gòu)特性分析不同變因?qū)蛹?jí),決策樹(shù),將結(jié)果轉(zhuǎn)成一系列分類(lèi)規(guī)則,並載入專(zhuān)家系統(tǒng)中,完成知識(shí)擷取,建立資料採(cǎi)礦模式?jīng)Q策樹(shù)分析建立顧客特性分類(lèi)決策樹(shù)將結(jié)果轉(zhuǎn)成一,9,群集分析建立顧客分群,利用群集分析,找出各群特性,群集分析建立顧客分群利用群集分析,找出各群特性,10,決策樹(shù)分析建立顧客特性分類(lèi),根據(jù)Lift Chart,Profit Chart檢視資料,決策樹(shù)分析建立顧客特性分類(lèi)根據(jù)Lift Chart,Pro,11,各群特性,第一群:高利潤(rùn),信用卡使用頻率低,未婚且1534歲族群,職業(yè)以農(nóng)、林、漁、牧業(yè)為最多,其次分別為事務(wù)職與銷(xiāo)售
5、職,第二群:高風(fēng)險(xiǎn),逾期超過(guò)30天佔(zhàn)10.81%,呆帳記錄佔(zhàn)9.86%,借款餘額800萬(wàn)佔(zhàn)12.40%,退票紀(jì)錄佔(zhàn)10.82%,拒往記錄佔(zhàn)10.82%,強(qiáng)制??ㄓ涗泚?zhàn)11.77%,年齡層為2554歲為主、已婚族群,刷卡金額有41.73%的人在4000160000元,第三群:高利潤(rùn),一年內(nèi)有申請(qǐng)的意願(yuàn),未婚年齡層主要為3549歲,個(gè)人收入20000元且其中有63.05%沒(méi)有收入,平均月開(kāi)銷(xiāo)在1000120000元,刷卡金額有49.28%的人在6000180000元,各群特性第一群:高利潤(rùn)第二群:高風(fēng)險(xiǎn)第三群:高利潤(rùn),12,結(jié)論,利用這些資訊提早預(yù)測(cè)出可能產(chǎn)生信用卡狀況不良的持卡人,並對(duì)於這些高危
6、險(xiǎn)群加以控管,以降低呆帳的發(fā)生機(jī)率,減少銀行的損失。,結(jié)論利用這些資訊提早預(yù)測(cè)出可能產(chǎn)生信用卡狀況不良的持卡人,並,13,建構(gòu)半導(dǎo)體晶圓允收測(cè)試資料採(cǎi)礦架構(gòu),建構(gòu)半導(dǎo)體晶圓允收測(cè)試資料採(cǎi)礦架構(gòu),14,研究動(dòng)機(jī),資料採(cǎi)礦在半導(dǎo)體產(chǎn)業(yè)上少見(jiàn)相關(guān)研究,。,迅速有效找到解決半導(dǎo)體製程中的事故原因,。,針對(duì),半導(dǎo)體晶圓允收,測(cè)試資料,發(fā)展製程事故診斷資料採(cǎi)礦結(jié)構(gòu),。,研究動(dòng)機(jī)資料採(cǎi)礦在半導(dǎo)體產(chǎn)業(yè)上少見(jiàn)相關(guān)研究。,15,研究架構(gòu),半導(dǎo)體製程事故診斷資料資料採(cǎi)礦架構(gòu),問(wèn)題定義與架構(gòu),資料準(zhǔn)備,建立採(cǎi)礦模式,結(jié)果解釋與評(píng)估,WAT與製程相關(guān)資料,Validation,Restructure,Assumptio
7、n,Induction,Deduction,Inference,研究架構(gòu)半導(dǎo)體製程事故診斷資料資料採(cǎi)礦架構(gòu)問(wèn)題定義與架構(gòu)資料,16,問(wèn)題定義,針對(duì)某年9月10日至9月15日的某WAT測(cè)試參數(shù)值異於正常,推測(cè)找出製程異常之原因,問(wèn)題定義針對(duì)某年9月10日至9月15日的某WAT測(cè)試參數(shù)值異,17,資料準(zhǔn)備,工程資料庫(kù)所蒐集的資料流程,薄膜,擴(kuò)散,黃光,蝕刻,貨批,WAT,CP,事故診斷,良率預(yù)測(cè),工程資料分析系統(tǒng),關(guān)連式資料庫(kù),資料準(zhǔn)備工程資料庫(kù)所蒐集的資料流程薄膜擴(kuò)散黃光蝕刻貨批WAT,18,建立資料採(cǎi)礦模式,決策樹(shù)分析在事故診斷的方法,利用層級(jí)架構(gòu)特性分析不同變因?qū)蛹?jí),將結(jié)果轉(zhuǎn)成一系列規(guī)則載入
8、專(zhuān)家系統(tǒng)中,完成製程診斷,製程最佳化與知識(shí)擷取,建立資料採(cǎi)礦模式?jīng)Q策樹(shù)分析在事故診斷的方法將結(jié)果轉(zhuǎn)成一系列規(guī),19,結(jié)果解釋與評(píng)估,決策樹(shù)分析結(jié)果,以樹(shù)狀結(jié)構(gòu)呈現(xiàn),並將其轉(zhuǎn)化為規(guī)則結(jié)論,結(jié)合專(zhuān)業(yè)知識(shí),確定事故發(fā)生原因,使用電子公司的半導(dǎo)體資料顯示:,1.使,用經(jīng)過(guò)各個(gè)站別的不同機(jī)臺(tái)參數(shù)資料縮小事故原因的資料個(gè)數(shù),2.利用資料轉(zhuǎn)換方式,引進(jìn)日期變數(shù)進(jìn)行決策樹(shù)分析,結(jié)果解釋與評(píng)估決策樹(shù)分析結(jié)果使用電子公司的半導(dǎo)體資料顯示:,20,資料採(cǎi)礦無(wú)處不在,商業(yè)問(wèn)題,Microsoft 演算法,預(yù)測(cè)類(lèi)別變數(shù),例如行銷(xiāo)回應(yīng)、顧客流失、違約預(yù)測(cè)(巴塞爾資本協(xié)定IRB),決策樹(shù),貝氏機(jī)率分類(lèi),群集,類(lèi)神經(jīng)網(wǎng)路,羅吉斯迴歸,預(yù)測(cè)連續(xù)變數(shù),例如預(yù)測(cè)銷(xiāo)售量、預(yù)測(cè)客戶價(jià)值變動(dòng)、預(yù)測(cè)金融商品價(jià)格波動(dòng).,迴歸樹(shù),時(shí)間序列,類(lèi)神經(jīng)網(wǎng)路,預(yù)測(cè)序列,例如找出網(wǎng)站使用者的點(diǎn)選路徑模式、客戶繳款行為模式、商品購(gòu)物順序,時(shí)序群集,找出產(chǎn)品交叉銷(xiāo)售關(guān)聯(lián)性,又稱為購(gòu)物籃分析,關(guān)聯(lián)規(guī)則,決策樹(shù),找出潛在相似性,例如市場(chǎng)區(qū)隔、偵測(cè)晶圓瑕疵分配、文件分類(lèi)、保險(xiǎn)浮濫理賠偵測(cè)、偽卡偵測(cè),群集,時(shí)序群集,資料採(cǎi)礦無(wú)處不在商業(yè)問(wèn)題Microsoft 演算法預(yù)測(cè)類(lèi)別變,21,投影片1Webcastingppt課件,22,