《投影片1Webcastingppt課件》由會員分享,可在線閱讀,更多相關(guān)《投影片1Webcastingppt課件(22頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、,按一下以編輯母片標(biāo)題樣式,按一下以編輯母片,第二層,第三層,第四層,第五層,*,金融與製造業(yè)應(yīng)用案例研討,謝邦昌,輔仁大學(xué)統(tǒng)計資訊學(xué)系 教授中華資料採礦協(xié)會 理事長,輔仁大學(xué) Data Mining 專題研究團隊,金融與製造業(yè)應(yīng)用案例研討謝邦昌,1,知識發(fā)現(xiàn)與資料採礦-,CRISP-DM,資料採礦步驟,Data,Business Understanding,Data Understanding,Data Preparation,Modeling,Evaluation,Deployment,知識發(fā)現(xiàn)與資料採礦-CRISP-DM資料採礦步驟DataBu,2,資料採礦功能,分類:主觀分類,推估:透
2、過信用卡張數(shù)及每月薪水推估其每月信用卡消費金額,預(yù)測:股價預(yù)測,關(guān)聯(lián)分組:產(chǎn)品組合促銷,集群化:客觀分群,資料採礦功能分類:主觀分類,3,資料採礦方法,群集分析是一種劃分方法,目的在將一些事物歸併在一起,利用群體中各事物都具有相同的特性,而在群體與群體之間卻有顯著的差異。,決策樹是從一個或多個預(yù)測變數(shù)中,針對類別應(yīng)變數(shù)的階級,預(yù)測案例或物件的關(guān)係;分類樹的目標(biāo)是針對類別應(yīng)變數(shù)加以預(yù)測或解釋反應(yīng)結(jié)果。,資料採礦方法群集分析是一種劃分方法,目的在將一些事物歸併在一,4,建構(gòu)銀行業(yè)信用卡顧客區(qū)隔之資料採礦架構(gòu),建構(gòu)銀行業(yè)信用卡顧客區(qū)隔之資料採礦架構(gòu),5,研究動機,高度競爭使得各發(fā)卡銀行對於審核信用卡
3、申請者之限制趨於寬鬆,而授信的品質(zhì)漸漸下滑,導(dǎo)致,催收帳款增加,,,呆帳日漸累積,,銀行需花大量成本和人力去處理這些壞帳反而得不償失。,掌握資料採礦針對通過給予發(fā)卡的客戶加以分類管理,以彌補不良的受信制度以及降低其風(fēng)險。,研究動機高度競爭使得各發(fā)卡銀行對於審核信用卡申請者之限制趨於,6,研究架構(gòu),資料採礦架構(gòu),問題定義與架構(gòu),結(jié)果解釋與評估,建立採礦模式,資料準(zhǔn)備,驗證,信用卡資料DB,研究架構(gòu)資料採礦架構(gòu)問題定義與架構(gòu)結(jié)果解釋與評估建立採礦模式,7,建立資料採礦模式,群集分析建立顧客分群,透過顧客特性資料,建立不同分群,各群中,顧客特質(zhì)具有高度同質(zhì)性,群集,建立資料採礦模式群集分析建立顧客分
4、群群集,8,建立資料採礦模式,決策樹分析建立顧客特性分類,利用層級架構(gòu)特性分析不同變因?qū)蛹?決策樹,將結(jié)果轉(zhuǎn)成一系列分類規(guī)則,並載入專家系統(tǒng)中,完成知識擷取,建立資料採礦模式?jīng)Q策樹分析建立顧客特性分類決策樹將結(jié)果轉(zhuǎn)成一,9,群集分析建立顧客分群,利用群集分析,找出各群特性,群集分析建立顧客分群利用群集分析,找出各群特性,10,決策樹分析建立顧客特性分類,根據(jù)Lift Chart,Profit Chart檢視資料,決策樹分析建立顧客特性分類根據(jù)Lift Chart,Pro,11,各群特性,第一群:高利潤,信用卡使用頻率低,未婚且1534歲族群,職業(yè)以農(nóng)、林、漁、牧業(yè)為最多,其次分別為事務(wù)職與銷售
5、職,第二群:高風(fēng)險,逾期超過30天佔10.81%,呆帳記錄佔9.86%,借款餘額800萬佔12.40%,退票紀(jì)錄佔10.82%,拒往記錄佔10.82%,強制??ㄓ涗泚?1.77%,年齡層為2554歲為主、已婚族群,刷卡金額有41.73%的人在4000160000元,第三群:高利潤,一年內(nèi)有申請的意願,未婚年齡層主要為3549歲,個人收入20000元且其中有63.05%沒有收入,平均月開銷在1000120000元,刷卡金額有49.28%的人在6000180000元,各群特性第一群:高利潤第二群:高風(fēng)險第三群:高利潤,12,結(jié)論,利用這些資訊提早預(yù)測出可能產(chǎn)生信用卡狀況不良的持卡人,並對於這些高危
6、險群加以控管,以降低呆帳的發(fā)生機率,減少銀行的損失。,結(jié)論利用這些資訊提早預(yù)測出可能產(chǎn)生信用卡狀況不良的持卡人,並,13,建構(gòu)半導(dǎo)體晶圓允收測試資料採礦架構(gòu),建構(gòu)半導(dǎo)體晶圓允收測試資料採礦架構(gòu),14,研究動機,資料採礦在半導(dǎo)體產(chǎn)業(yè)上少見相關(guān)研究,。,迅速有效找到解決半導(dǎo)體製程中的事故原因,。,針對,半導(dǎo)體晶圓允收,測試資料,發(fā)展製程事故診斷資料採礦結(jié)構(gòu),。,研究動機資料採礦在半導(dǎo)體產(chǎn)業(yè)上少見相關(guān)研究。,15,研究架構(gòu),半導(dǎo)體製程事故診斷資料資料採礦架構(gòu),問題定義與架構(gòu),資料準(zhǔn)備,建立採礦模式,結(jié)果解釋與評估,WAT與製程相關(guān)資料,Validation,Restructure,Assumptio
7、n,Induction,Deduction,Inference,研究架構(gòu)半導(dǎo)體製程事故診斷資料資料採礦架構(gòu)問題定義與架構(gòu)資料,16,問題定義,針對某年9月10日至9月15日的某WAT測試參數(shù)值異於正常,推測找出製程異常之原因,問題定義針對某年9月10日至9月15日的某WAT測試參數(shù)值異,17,資料準(zhǔn)備,工程資料庫所蒐集的資料流程,薄膜,擴散,黃光,蝕刻,貨批,WAT,CP,事故診斷,良率預(yù)測,工程資料分析系統(tǒng),關(guān)連式資料庫,資料準(zhǔn)備工程資料庫所蒐集的資料流程薄膜擴散黃光蝕刻貨批WAT,18,建立資料採礦模式,決策樹分析在事故診斷的方法,利用層級架構(gòu)特性分析不同變因?qū)蛹?將結(jié)果轉(zhuǎn)成一系列規(guī)則載入
8、專家系統(tǒng)中,完成製程診斷,製程最佳化與知識擷取,建立資料採礦模式?jīng)Q策樹分析在事故診斷的方法將結(jié)果轉(zhuǎn)成一系列規(guī),19,結(jié)果解釋與評估,決策樹分析結(jié)果,以樹狀結(jié)構(gòu)呈現(xiàn),並將其轉(zhuǎn)化為規(guī)則結(jié)論,結(jié)合專業(yè)知識,確定事故發(fā)生原因,使用電子公司的半導(dǎo)體資料顯示:,1.使,用經(jīng)過各個站別的不同機臺參數(shù)資料縮小事故原因的資料個數(shù),2.利用資料轉(zhuǎn)換方式,引進日期變數(shù)進行決策樹分析,結(jié)果解釋與評估決策樹分析結(jié)果使用電子公司的半導(dǎo)體資料顯示:,20,資料採礦無處不在,商業(yè)問題,Microsoft 演算法,預(yù)測類別變數(shù),例如行銷回應(yīng)、顧客流失、違約預(yù)測(巴塞爾資本協(xié)定IRB),決策樹,貝氏機率分類,群集,類神經(jīng)網(wǎng)路,羅吉斯迴歸,預(yù)測連續(xù)變數(shù),例如預(yù)測銷售量、預(yù)測客戶價值變動、預(yù)測金融商品價格波動.,迴歸樹,時間序列,類神經(jīng)網(wǎng)路,預(yù)測序列,例如找出網(wǎng)站使用者的點選路徑模式、客戶繳款行為模式、商品購物順序,時序群集,找出產(chǎn)品交叉銷售關(guān)聯(lián)性,又稱為購物籃分析,關(guān)聯(lián)規(guī)則,決策樹,找出潛在相似性,例如市場區(qū)隔、偵測晶圓瑕疵分配、文件分類、保險浮濫理賠偵測、偽卡偵測,群集,時序群集,資料採礦無處不在商業(yè)問題Microsoft 演算法預(yù)測類別變,21,投影片1Webcastingppt課件,22,