《《教育統(tǒng)計與測量》PPT課件》由會員分享,可在線閱讀,更多相關(guān)《《教育統(tǒng)計與測量》PPT課件(32頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、教育統(tǒng)計與測量 職教學(xué)院 張闊 主要參考文獻(xiàn)黃光揚主編:教育測量與評價, 華東師范大學(xué)出版社,2002年。張厚粲主編:心理與教育統(tǒng)計學(xué), 北京師范大學(xué)出版社,2004年。 A. Anastasi : Psychological Testing, Prentice Hall Inc. ,1997。 名人談教育統(tǒng)計與測量 從事教育的人若不懂教育統(tǒng)計學(xué)就不能稱為教育科學(xué)家。 心理學(xué)家、教育學(xué)家 艾偉 在一些教育科學(xué)論文里大都是抽象文字描述和典型事例說明,缺乏定量分析,很難說有多高的科學(xué)性。 姚依林 “統(tǒng)計是制定政策的主要依據(jù)” 怎樣運用數(shù)據(jù)和我們的科學(xué)水平有關(guān),停留在生動和突出事例來說明問題這樣的水
2、平是危險的,容易犯寬大的毛病,結(jié)果會導(dǎo)致脫離實際的偏向。 費孝通 “開展教育社會學(xué)研究” 緒論概念教育統(tǒng)計學(xué):是運用數(shù)理統(tǒng)計的原理和方法研究教育問題的一門應(yīng)用科學(xué)。教育測量學(xué):對學(xué)校教育影響下學(xué)生各方面的發(fā)展,定量地予以確定和描述的學(xué)科。學(xué)習(xí)教育統(tǒng)計與測量的意義教育科學(xué)研究的基本方法定量分析的重要工具教育工作者的必備知識 一、教育統(tǒng)計初步知識集中量數(shù): 代表一組數(shù)據(jù)典型水平或集中趨勢的量。差異量數(shù): 代表一組數(shù)據(jù)離散程度、變異程度的量。相關(guān)系數(shù): 用于描述兩個或多個變量間關(guān)聯(lián)程度的量。正態(tài)分布學(xué)生成績的初步分析 集中量數(shù)和差異量數(shù)算術(shù)平均數(shù)中位數(shù):按大小順序排列,位于中間位置的數(shù)。眾數(shù):出現(xiàn)頻
3、數(shù)最多的數(shù)。 ni iXnX 11 M或X dM0M 全距平均差方差標(biāo)準(zhǔn)差n XX i n XXi 22 n XXi 2 minmaxRange 4 n MX平均差 4.2422 n XXi 分?jǐn)?shù)離差 X - M離差平方 (XM)278 +8 6477 +7 4973 +3 9Md=70.5 71 +1 1M0=71 71 +1 1Mean=70 70 0 0Range=16 68 -2 466 -4 1664 -6 3662 -8 64X=700 (X-M)=0 (XM) 2=244 9.42 n XXi 相關(guān)系數(shù)積差相關(guān):兩變量均為正態(tài)連續(xù)變量,(一般n30)。 22 22yx xyn x
4、yr YYyXXx YYXX YYXXn YYXXr yx ii ii iiyx ii 可得;令相關(guān)系數(shù)的取值范圍在-11之間,其絕對值越大,表明兩變量間的線性關(guān)聯(lián)越強(qiáng)。 高數(shù)X化學(xué)Y x=X- y= Y- x2 y2 xy李安71 77 +1 -4 1 16 -4李連杰68 88 -2 +7 4 49 -14趙明78 82 +8 +1 64 1 8何其兵62 76 -8 -5 64 25 40郭宇64 78 -6 -3 36 9 18成小亮66 75 -4 -6 16 36 24露思71 84 +1 +3 1 9 3瑪麗73 80 +3 -1 9 1 -3湯姆77 83 +7 +2 49 4
5、 14杰克70 87 0 +6 0 36 0 400 210 0 0 244 186 86X Y 94.410244x 31.410186y 40.031.494.410 86 yxxy n xyr 正態(tài)分布和正態(tài)曲線最為常見一種概率分布形態(tài),在理論和實踐中均有廣泛的應(yīng)用。密度函數(shù)簡記特征:單峰、對稱 2 222 xenY 2,N決定峰高和寬窄。決定分布的中心位置, 學(xué)生成績的初步分析分段統(tǒng)計分?jǐn)?shù)段人數(shù)90 5分?jǐn)?shù)分布形態(tài)注: (1)各分?jǐn)?shù)段的區(qū)間大小應(yīng)根據(jù)實際需要確定。 (2)一般要求學(xué)生的成績分布為正態(tài)或負(fù)偏態(tài)。 二、教育測量的質(zhì)量特性教育測量的特點:間接性、相對性測驗的信度測驗的效度題目
6、的難度題目的區(qū)分度 測驗的信度信度(reliability):測驗的穩(wěn)定性、可靠性程度。信度的統(tǒng)計定義信度的種類重測信度:同一測驗對同組被試先后兩次施測所得結(jié)果 的一致性程度。復(fù)本信度:兩平行測驗對同組被試施測所得結(jié)果 的一致性程度。 同質(zhì)性信度:測驗內(nèi)部所有題目間的一致性程度。22 222 / XTxx ETXr ETX 復(fù)本信度的估計方法高數(shù)X高數(shù)Y x=X- y= Y- x2 y2 xy李安71 77 +1 -4 1 16 -4李連杰68 88 -2 +7 4 49 -14趙明78 82 +8 +1 64 1 8何其兵62 76 -8 -5 64 25 40郭宇64 78 -6 -3 3
7、6 9 18成小亮66 75 -4 -6 16 36 24露思71 84 +1 +3 1 9 3瑪麗73 80 +3 -1 9 1 -3湯姆77 83 +7 +2 49 4 14 杰克70 87 0 +6 0 36 0 700 810 0 0 244 186 8631.410186y 40.031.494.410 86 yxxy n xyr 94.410244x X Y 測驗的效度效度(Validity):測驗的有效性程度,即測驗實際測量出其所要測量特性的程度。效度始終是針對一定測量目的而言的效度只有程度上的差異效度要從多方面、多角度加以驗證效度的統(tǒng)計定義從某種意義上說,效度比信度更重要。 2
8、2 222222 / XVxy EIVETXr EIVETX 測驗的效度 效度的種類及其分析方法內(nèi)容效度:測驗題目樣本對于應(yīng)測內(nèi)容與行為領(lǐng)域的代表性程度。 邏輯分析結(jié)構(gòu)效度:測驗反映某種理論構(gòu)想的準(zhǔn)確性程度。 因素分析效標(biāo)關(guān)聯(lián)效度:測驗對于特定情境下個體行為進(jìn)行預(yù)測的有效性程度。 相關(guān)分析效標(biāo):判斷測驗效度(預(yù)測有效性)的外部標(biāo)準(zhǔn)。 提高測驗信、效度的方法測驗中題目的數(shù)量應(yīng)適當(dāng),不能太少。緊密圍繞教學(xué)大綱和教學(xué)目標(biāo)命題??己藘?nèi)容應(yīng)全面,并能有效代表學(xué)生應(yīng)掌握的知識領(lǐng)域。測驗的整體難度適當(dāng),不同類型、不同難度的題目應(yīng)保持恰當(dāng)比例。少出偏題、怪題,一般應(yīng)以考察基礎(chǔ)知識和基本能力為主。 題目的難度難
9、度:被試完成題目(item)任務(wù)時所遇到的困難程度。 難度系數(shù):定量地刻畫被試作答題目時困難程度的量值。P 難度系數(shù)的估計全體考生得分率(或失分率)高低分組法:兩端組被試(各27%)得分率的均值 為選項數(shù),選擇題的難度系數(shù)校正K1k 1kPCPmax i ii XXP 2 LH PPP 題的總分值;:第題的平均得分;:考生第i imaxiiXX 題目的區(qū)分度區(qū)分度:題目區(qū)分被試能力、水平的能力,又稱鑒別力。 D區(qū)分度的估計方法 相關(guān)法:計算題目得分與總分相關(guān)。其中積差相關(guān)適用于多值計分題目;點二列相關(guān)適用于二值計分題目。高低分組法:以高分組和低分組在特定題目上得分率之差作為衡量區(qū)分度的指標(biāo)。
10、LH PPD 鑒別力指數(shù) 多值計分題目(如簡答、論述) 0.7228001012022 yx xyn YYXXr yx ii 題目分X總分Y x=X- y= Y- x2 y2 xy里沙1 30 -2 -40 4 1600 80露思2 80 -1 10 1 100 -10瑪麗3 80 0 10 0 100 0湯姆4 60 1 -10 1 100 -10杰克5 100 2 30 4 900 60 15 350 10 2800 120X Y 區(qū)分度估計值:題分與總分的積差相關(guān)系數(shù)。 二值計分題目(如選擇、填空、判斷)學(xué)生A B C D E F G H I J K L總分90 81 80 78 77
11、70 69 65 55 50 49 42題分1 0 1 1 1 1 1 0 0 0 1 0區(qū)分度估計值:題分與總分的點二列相關(guān)系數(shù) 5.012512747.14 6.5829.73x pqXXr qppb 12512758.65 4250556581 73.297 49697077788090 qpXXqp, 題目的區(qū)分度區(qū)分度的一般評價標(biāo)準(zhǔn)0.2以下 應(yīng)淘汰;0.20.3 合格題目,可能需加以改進(jìn);0.30.4 良好;0.41 性能頗佳。測驗題目難度與區(qū)分度的關(guān)系題目難度、區(qū)分度與測驗信、效度之間關(guān)系復(fù)雜。測驗中題目的總體難度過高或過低,都會導(dǎo)致測驗的總體區(qū)分能力降低。所以一般說來,中等難度
12、的題目應(yīng)占4060%。 題目分析之三:作答反應(yīng)分析目的: 對教與學(xué)過程中可能存在的問題進(jìn)行診斷。內(nèi)容:選擇題中不同選項被選頻數(shù)的分析;學(xué)生集中出現(xiàn)的錯誤反應(yīng)及其原因等。示例:題號組別選答人數(shù)難度P區(qū)分度DA B C D未答1 H 5 31 4 3 0 0.48 0.5L 12 10 13 7 12 H 14 16 5 8 0 0.16 0.05L 15 15 7 6 0正常: H組選擇正確答案最多,其他均勻分布異常:H、L組對不正確答案選擇過多表明題目或教學(xué)存在疏 失; H、L組對正確答案選擇很接近說明題目缺乏鑒別力。 三、測驗編制的一般原理與方法題目類型及其測量功能選擇題填空題判斷題簡答題論
13、述題標(biāo)準(zhǔn)化測驗編制的一般程序教師自編測驗 選擇題優(yōu)點可以測量學(xué)生多種層次的學(xué)習(xí)結(jié)果評分標(biāo)準(zhǔn)統(tǒng)一、客觀,有利于提高評閱的速度允許較大的試題容量,可以保障題目的覆蓋范圍和代表性可根據(jù)學(xué)生對似真選項的選擇情況進(jìn)行診斷缺點無法了解被試作答時的思維過程難以考核被試的綜合能力 具有似真性的干擾選項有時不好編制存在猜中答案的幾率 選擇題編制原則題干意義完整,問題表述明確題干及選項的語言均應(yīng)簡明,避免濫用否定結(jié)構(gòu)、復(fù)雜句式誘答項應(yīng)具有似真性同一測驗中各題目應(yīng)盡量保持獨立,避免相互牽連正確答案不能有明顯組型 填空題特點主要用于考察被試對基本知識的記憶和理解能力。受被試猜測影響小,評分較客觀。無法測量高級的學(xué)習(xí)結(jié)
14、果。使用過多容易造成被試的死記硬背。編制原則題意要明確,限定要嚴(yán)密,以保證空白處應(yīng)填答案的唯一性。題目中空白部分以一處為宜,過多則使題干支離破碎。 所有空白處的線段長度應(yīng)一致,避免產(chǎn)生暗示作用。若答案是數(shù)字,應(yīng)指明單位或數(shù)字的精確程度。 簡答題特點適合于考察被試對基本知識、概念和原理的掌握、記憶情況。編制簡單、靈活。編制原則問題敘述清楚、明確。答案要簡短具體,使被試可以用簡潔的語言來回答,避免繁瑣的計算和長篇大論。避免只出機(jī)械記憶性的題目,應(yīng)注重知識的應(yīng)用。 論述題優(yōu)點可以用來對高層次、復(fù)雜學(xué)習(xí)結(jié)果的測量??梢杂糜诟鲗W(xué)科領(lǐng)域,特別適用于人文、社會科學(xué)領(lǐng)域。可以增進(jìn)學(xué)生的思考、應(yīng)用及解決問題的能
15、力,對于被試的學(xué)習(xí)態(tài)度和學(xué)習(xí)方式可以產(chǎn)生積極的影響。如可以促使學(xué)生注意教材內(nèi)容的內(nèi)在聯(lián)系和對所學(xué)知識進(jìn)行有機(jī)的組織。試題編制相對容易,可以增進(jìn)被試的寫作能力。缺點論述題一般都是大題,因此在一次考試中試題的取樣范圍比較小,且分布不均勻,難以做到全面考察。評分的主觀性強(qiáng)。即使有參考答案和評分標(biāo)準(zhǔn),但因被試的回答自由,回答問題的方向也不盡相同,評分的主觀性仍難以避免。 被試作答和評分閱卷均較為費時。 論述題編制原則試題應(yīng)該用來測量較高層次的學(xué)習(xí)目標(biāo)(如分析、綜合、評價),特別是那些小型客觀題不易測量的學(xué)業(yè)成就。如要求學(xué)生陳述理由、解釋變量間關(guān)系,描述與評價資料、推理證明等。要明確而系統(tǒng)地陳述問題,使被試能清楚地了解題目的要求。使每道題都能真實地反映被試實際能力而不受閱讀理解等其他因素干擾。不同的論述題之間很難做到等值,因此一般不要讓被試選擇問題回答,否則不同被試的得分難以比較。 標(biāo)準(zhǔn)化測驗編制的一般程序明確測驗的性質(zhì)和目標(biāo)選擇和收集測驗材料編寫試題(命題)試測和題目分析合成測驗、編制復(fù)本收集信效度資料、編寫測驗手冊 教師自編測驗教師自編測驗的特點形式靈活、簡易快速內(nèi)容緊扣大綱及教學(xué)內(nèi)容難度適合學(xué)生實際水平用科學(xué)原理指導(dǎo)測驗編制工作深入研究教材、深入了解學(xué)生制定恰當(dāng)?shù)暮细駱?biāo)準(zhǔn)合理使用各種題型注意總結(jié)經(jīng)驗、提高命題技術(shù)控制評分誤差,防止簡單粗糙