《開題報告(數(shù)據(jù)挖掘)--課件》由會員分享,可在線閱讀,更多相關(guān)《開題報告(數(shù)據(jù)挖掘)--課件(19頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、,單擊此處編輯母版標題樣式,單擊此處編輯母版文本樣式,第二級,第三級,第四級,第五級,*,ppt課件,*,單擊此處編輯母版標題樣式,單擊此處編輯母版文本樣式,第二級,第三級,第四級,第五級,*,ppt課件,*,數(shù)據(jù)挖掘在高職教學中的應(yīng)用,匯報人:,導 師:,學 院:計算機科學與技術(shù)學院,1,ppt課件,數(shù)據(jù)挖掘在高職教學中的應(yīng)用匯報人:1ppt課件,內(nèi)容概要,選題目的和意義,國內(nèi)外研究動態(tài),研究的主要內(nèi)容,實驗設(shè)計方案,準備工作情況和主要工作措施,論文進度安排及預期達到研究結(jié)果,2,ppt課件,內(nèi)容概要選題目的和意義 2ppt課件,選題目的和意義,由于我國大眾化高等教育的普及,高校學生數(shù)量的激
2、增,給高校教學工作帶來了諸多新的問題。尤其是高職學生,他們的主體是普通高中應(yīng)屆畢業(yè)生高考最后一批錄取的學生。這些學生在學習意識、學習方法、學習能力及學習動力上比較欠缺,并可能有較多常見的心理問題。,大部分學生沒有養(yǎng)成良好的學習習慣。他們中的大部分學習基礎(chǔ)比較差、自制力也比較弱,學習目標不夠明確,缺乏刻苦鉆研精神。很多學生就讀離職并不是因為自身渴望學習,而是無可奈何或出于應(yīng)付家長的要求。,他們對所學的專業(yè)并沒有太多了解,因此學習目標不夠明確同時,他們還對社會對其的容納有一種懷疑,這種懷疑直接導致了自信心的不足,由此也影響到學生學習的動力。此外,由于這批學生普遍沒有養(yǎng)成良好的學習習慣,叉影響了良好
3、學習氛圍的營造,不良的學習氛圍又反過來影響學生的學習動力。,教師迫切地需要科學地研究高職教學各個環(huán)節(jié)中的大量的數(shù)據(jù)信息,從中獲取知識,繼而科學地指導教學。,3,ppt課件,選題目的和意義由于我國大眾化高等教育的普及,高校學生數(shù)量的激,選題目的和意義,二十世紀,數(shù)據(jù)庫技術(shù)取得了決定性的成果并且得到廣泛應(yīng)用。大量信息在給人們帶來方便的同時也帶來了一大堆難題:,第一是信息過量,難以消化;,第二是信息真假難以辨識:,第三是信息安全難以保證;,第四是信息形式不一致,難以統(tǒng)一處理。,4,ppt課件,選題目的和意義二十世紀,數(shù)據(jù)庫技術(shù)取得了決定性的成果并且得到,選題目的和意義,數(shù)據(jù)挖掘技術(shù),(Data Mi
4、ning),被稱為未來信息處理的骨干技術(shù)之一,是一個多學科交叉研究領(lǐng)域,融合了數(shù)據(jù)庫,人工智能、機器學習,統(tǒng)計學,知識工程、面向?qū)ο蠓椒ā⑿畔z索,高性能計算以及數(shù)據(jù)可視化等多項最新技術(shù),數(shù)據(jù)挖掘技術(shù)從,80,年代末開始出現(xiàn)。短短二十多年它的發(fā)展速度很快。目前數(shù)據(jù)挖掘技術(shù)在零售業(yè)的購物籃分析、金融風險預測、產(chǎn)品質(zhì)量分析、通訊及醫(yī)療服務(wù)、基因工程研究等許多領(lǐng)域得到了成功的應(yīng)用。很多專題會議也把數(shù)據(jù)挖掘和知識發(fā)現(xiàn)列為議題之一。,5,ppt課件,選題目的和意義數(shù)據(jù)挖掘技術(shù)(Data Mining)被稱為未,選題目的和意義,雖然目前數(shù)據(jù)挖掘技術(shù)主要在商業(yè)領(lǐng)域中得到廣泛發(fā)展,但它面向應(yīng)用的本質(zhì)決定了在任
5、何需要的領(lǐng)域都會發(fā)揮它的價值。,在高校教育教學及管理中有大量直接或間接的數(shù)據(jù),關(guān)系到教師評價、人才管理及學生選課指導、學生成績分析等內(nèi)容。把數(shù)據(jù)挖掘技術(shù)應(yīng)用于高等學校的教學與管理中,是數(shù)據(jù)挖掘技術(shù)在又一個領(lǐng)域的應(yīng)用。,6,ppt課件,選題目的和意義雖然目前數(shù)據(jù)挖掘技術(shù)主要在商業(yè)領(lǐng)域中得到廣泛發(fā),選題目的和意義,高等學校多年來的教學和管理工作積累了大量的數(shù)據(jù),目前,鑒于社會對高等學校發(fā)展的需求和高校數(shù)據(jù)管理的現(xiàn)狀,利用這些數(shù)據(jù)理性的分析學校各方面工作的成效以及教師發(fā)展狀況,對高校教學管理決策支持系統(tǒng)的影響變得十分重要。,利用數(shù)據(jù)挖掘技術(shù)從數(shù)據(jù)倉庫中獲取高質(zhì)量的信息,可以檢驗教學效果,調(diào)節(jié)課程設(shè)置
6、。合理安排師資,正確評價教師的年度工作,及輔助調(diào)整招生計劃、分析預測就業(yè)趨勢等等。,7,ppt課件,選題目的和意義7ppt課件,選題目的和意義,以學生成績?yōu)槔?,教師對學生成績的分析處理一般僅僅是統(tǒng)計成績處在優(yōu)、一般、差級別的人數(shù),對于學生取得這些成績的原因往往無法了解。如果教師能夠找到有關(guān)影響學生學習成績的因素,必然對教學質(zhì)量的提高起到積極的作用。,8,ppt課件,選題目的和意義以學生成績?yōu)槔?,教師對學生成績的分析處理一般僅,國內(nèi)外研究動態(tài),自,1989,年第,11,屆國際聯(lián)合人工智能學術(shù)會議上首次提出,KDD,這一概念以來,數(shù)據(jù)挖掘日益受到人們的關(guān)注。并已經(jīng)成為當前計算機領(lǐng)域的一大熱點,其研
7、究的重點也逐漸從發(fā)現(xiàn)方法轉(zhuǎn)移到系統(tǒng)應(yīng)用,并且注重多種發(fā)現(xiàn)策略和技術(shù)的集成,以及多學科之間的相互滲透。,從總體上,國外在數(shù)據(jù)挖掘領(lǐng)域中的研究內(nèi)容十分廣泛,從挖掘知識的種類看,己經(jīng)取得了明顯的成果。,9,ppt課件,國內(nèi)外研究動態(tài) 自1989年第11屆國際聯(lián)合人工智能學術(shù)會議,國內(nèi)外研究動態(tài),1,、關(guān)聯(lián)規(guī)則的研究。近幾年對關(guān)聯(lián)規(guī)則的研究內(nèi)容較多?,F(xiàn)在,關(guān)聯(lián)規(guī)則的挖掘已經(jīng)從單一概念層次關(guān)聯(lián)規(guī)則的發(fā)現(xiàn)發(fā)展到多概念層次關(guān)聯(lián)規(guī)則的發(fā)現(xiàn),并把研究的重點放在提高算法的效率和規(guī)??墒湛s性上。目前,人們對于定量關(guān)聯(lián)規(guī)則以及其他種類的關(guān)聯(lián)規(guī)則的發(fā)現(xiàn)研究較為深入,提出了關(guān)聯(lián)規(guī)則的興趣性的概念。與此同時,在提高挖掘過程
8、的效率方面也作了不少的研究。,2,、數(shù)據(jù)分類技術(shù)研究?;跊Q策樹的分類方法在大規(guī)模數(shù)據(jù)庫條件下的應(yīng)用研究;在較高的抽象層次分類中,,M,Mehte,等人針對大型數(shù)據(jù)庫提出了一種快速分類算法,稱為,QUEST,中的超級學習算法,,SLIQ,:分類與回歸的管狀領(lǐng)域研究、最近鄰分類方法的改進等等。,10,ppt課件,國內(nèi)外研究動態(tài) 1、關(guān)聯(lián)規(guī)則的研究。近幾年對關(guān)聯(lián)規(guī)則的研究內(nèi),國內(nèi)外研究動態(tài),3,、聚類規(guī)則研究。近年,聚類開始在大型數(shù)據(jù)庫中得到研究,,R,Ng,和,1,Han,基于隨機搜索以及統(tǒng)計學中的兩個聚類算法,PAM,和,CLARA,,給出了一個適用于大型應(yīng)用的聚類算法:,CLARANS,。,
9、M,Este,等人針對,CLARANS,算法的缺點,提出了改進技術(shù)。,T,Zhang,等人則提出了另一種聚類算法:,BIRCH,。,4,、泛化、簡約和特征提取研究。利用數(shù)據(jù)可視化大大擴展了數(shù)據(jù)的表達和理解能力,這是數(shù)據(jù)簡約的一種非常重要的技術(shù),它正受到廣泛的重視。,11,ppt課件,國內(nèi)外研究動態(tài) 11ppt課件,國內(nèi)外研究動態(tài),與國外相比,國內(nèi)對數(shù)據(jù)挖掘與知識發(fā)現(xiàn),(MDKD),的研究稍晚,,1993,年國家自然科學基金首次支持對該領(lǐng)域的研究項目。目前,清華大學、中科院計算技術(shù)研究所、空軍第三研究所、海軍裝備論證中心等競相開展數(shù)據(jù)挖掘的基本理論及其應(yīng)用研究。,其中,北京系統(tǒng)工程研究所對模糊方
10、法在知識發(fā)現(xiàn)中的應(yīng)用進行了較深入的研究,北京大學也在開展對數(shù)據(jù)立方體代數(shù)的研究;華中理工大學、復旦大學、浙江大學、中國科技大學、中科院數(shù)學研究所、吉林大學等單位開展了對關(guān)聯(lián)規(guī)則開采算法的優(yōu)化和改造;南京大學、四川聯(lián)合大學山東師范大學碩士學位論文上海交通大學等單位探討,研究了非結(jié)構(gòu)化數(shù)據(jù)的知識發(fā)現(xiàn)以及,Web,數(shù)據(jù)挖掘。,數(shù)據(jù)挖掘最先應(yīng)用于金融和商業(yè)領(lǐng)域,在教育層面上還只能算是新生事物,處于發(fā)展的初級階段。,12,ppt課件,國內(nèi)外研究動態(tài) 與國外相比,國內(nèi)對數(shù)據(jù)挖掘與知識發(fā)現(xiàn)(MDK,國內(nèi)外研究動態(tài),國內(nèi)高校目前在校園信息網(wǎng)中開展數(shù)據(jù)挖掘的研究并不廣泛。浙江大學使用關(guān)聯(lián)規(guī)則發(fā)現(xiàn)技術(shù)對高校的人事
11、信息庫進行挖掘,試圖找到影響學科發(fā)展的因素,發(fā)現(xiàn)如何評價一個學科,以及影響學科發(fā)展的各個要素之間的關(guān)系。,在教育信息化的大趨勢下,將數(shù)據(jù)挖掘技術(shù)應(yīng)用于教育領(lǐng)域內(nèi)的學生招募、市場細分、學生來源分析、課程相關(guān)性、學習評價度量、學生生涯規(guī)劃、遠程開放教育的個性化服務(wù)等方面,必然有十分廣闊的前景。,13,ppt課件,國內(nèi)外研究動態(tài) 13ppt課件,研究的主要內(nèi)容,本文主要研究在高校擴招、師生比過大的教學條件下,教師如何利用豐富的信息資源,采用數(shù)據(jù)挖掘技術(shù),獲得輔助決策知識,指導教學,從而進一步提高教學質(zhì)量。,數(shù)據(jù)挖掘技術(shù)主要介紹數(shù)據(jù)挖掘的基本知識,包括數(shù)掘挖掘的過程、數(shù)據(jù)挖掘的任務(wù)、數(shù)掘挖掘的分類以及
12、數(shù)據(jù)挖掘的常用技術(shù)和方法。探索數(shù)據(jù)挖掘技術(shù)在高校教學中的應(yīng)用,提出數(shù)據(jù)挖掘技術(shù)在高校教學應(yīng)用中的實施方案。,14,ppt課件,研究的主要內(nèi)容 14ppt課件,實驗設(shè)計方案,第一步,確定挖掘?qū)ο?、目標。清晰地定義出問題,認清數(shù)據(jù)挖掘的目的是數(shù)據(jù)挖掘的重要一步。挖掘的最后結(jié)果是不可預測的,但要探索的問題應(yīng)是有預見的。,第二步,數(shù)據(jù)采集。這是一個工作量較大,占據(jù)時問較多的一個階段。教師需要在以往的教學實踐中,注意收集數(shù)據(jù)信息,有些數(shù)據(jù)的產(chǎn)生可以直接獲得,有些數(shù)據(jù)需要對學生進行調(diào)查獲得。,第三步,數(shù)據(jù)轉(zhuǎn)換。這一步是將教師收集到的不同的數(shù)據(jù)信息集成并轉(zhuǎn)換為一個分析數(shù)據(jù)模型,這一數(shù)掘模型是針對算法而準備的
13、不同的算法可能需要不同的分析數(shù)據(jù)模型。,15,ppt課件,實驗設(shè)計方案 第一步,確定挖掘?qū)ο?、目標。清晰地定義出問題,,實驗設(shè)計方案,第四步,數(shù)據(jù)分類挖掘。分類挖掘的目的是為了建立一個分類模型。首先要選擇合適的挖掘算法,并使用合適的程序設(shè)計軟件實現(xiàn)這一算法:接著對所得到的經(jīng)過轉(zhuǎn)換的數(shù)據(jù)進行挖掘。,第五步,分類規(guī)則結(jié)果分析。這一步主要解釋和評估分類結(jié)果。,第六步。知識的應(yīng)用。這一步是將分析所得到的知識集成到教師的教學環(huán)節(jié)中去,教師可利用所得知識改進教學策略,指導下一步教學。,16,ppt課件,實驗設(shè)計方案 16ppt課件,準備工作情況和主要工作措施,利用學院的教務(wù)管理系統(tǒng),獲得學生的成績信息。設(shè)
14、計學生信息調(diào)查表,由學生填寫,內(nèi)容包括學生對計算機公共基礎(chǔ)課程的感興趣程度、課堂學習效果、對本課程的認識和教師的教學方法等。,利用數(shù)據(jù)挖掘算法對數(shù)據(jù)進行處理,建立決策樹,得出推動計算機課程教學的規(guī)則。,17,ppt課件,準備工作情況和主要工作措施 利用學院的教務(wù)管理系統(tǒng),獲得學生,論文進度安排及預期達到研究結(jié)果,2010.4-2010.9,資料查詢、確定論文主題,2010.9-2010.11,數(shù)據(jù)挖掘的理論研究,2010.11-2010.12,數(shù)據(jù)挖掘的應(yīng)用研究,2011.1-2011.3,撰寫論文,2011.4-2011.5,論文修改,18,ppt課件,論文進度安排及預期達到研究結(jié)果 2010.4-2010.9,謝謝!,請老師和同學們批評指正,19,ppt課件,謝謝!19ppt課件,