《語言統(tǒng)計(jì)第四章離中趨勢(shì)與差異量數(shù)》由會(huì)員分享,可在線閱讀,更多相關(guān)《語言統(tǒng)計(jì)第四章離中趨勢(shì)與差異量數(shù)(30頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
1、單擊此處編輯母版標(biāo)題樣式,*,單擊此處編輯母版文本樣式,第二級(jí),第三級(jí),第四級(jí),第五級(jí),單擊此處編輯母版標(biāo)題樣式,單擊此處編輯母版文本樣式,第二級(jí),第三級(jí),第四級(jí),第五級(jí),*,第一節(jié) 離中趨勢(shì)與差異量數(shù),一、離中趨勢(shì)的概念,二、差異量數(shù)的作用,三.主要的差異量數(shù)分類,第二節(jié) 兩極差,一、兩極差的概念,二、兩極差的求法,第三節(jié) 四分差,一、四分差的概念,二、四分差的求法,第四節(jié) 平均差,一、平均差的概念,二、平均差的求法,第五節(jié) 標(biāo)準(zhǔn)差與方差,一、標(biāo)準(zhǔn)差與方差的概念,二、標(biāo)準(zhǔn)差與方差的求法,第六節(jié) 標(biāo)準(zhǔn)差的應(yīng)用數(shù)據(jù)的標(biāo)準(zhǔn)化,一、考分比較,二、標(biāo)準(zhǔn)化與標(biāo)準(zhǔn)分,三、標(biāo)準(zhǔn)分的應(yīng)用,四、標(biāo)準(zhǔn)分與正態(tài)分布
2、和百分位的關(guān)系,第四章 離中趨勢(shì)與差異量數(shù),第一節(jié) 離中趨勢(shì)與差異量數(shù),一、離中趨勢(shì)的概念:,離中趨勢(shì)指的是一組數(shù)據(jù)的變異或離散程度。對(duì)離中趨勢(shì)進(jìn)行度量的統(tǒng)計(jì)量稱作差異量數(shù)。離中趨勢(shì)的度量是描述統(tǒng)計(jì)的一個(gè)重要方面。,二、差異量數(shù)的作用:,1.能從另一個(gè)角度了解數(shù)據(jù)的性質(zhì)。,2.有助于檢驗(yàn)或說明集中量數(shù)的代表性,差異量數(shù)越大,集中量數(shù)的代表性就越小;,差異量數(shù)越小,集中量數(shù)的代表性就越大;,差異量數(shù)為零,那么說明數(shù)據(jù)中各個(gè)數(shù)值之間沒有任何差異,都等于平均數(shù),平均數(shù)的代表性最大,三.主要的差異量數(shù)分類:,1.;兩極差 2.四分差 3.平均差 4.標(biāo)注差與方差,舉個(gè)例子:,我們兩組假設(shè)的分?jǐn)?shù)來舉個(gè)例
3、子:,第一組:60 75 78 80 82 85 100,第二組:74 77 80 80 80 83 86,兩組分?jǐn)?shù)段餓平均差都是80,然而其離散程度卻差異很大,如果每組數(shù)據(jù)中的最大值與最小值之差來表示離散程度,那么第一組為100-60=40,第二組為86-74=12。兩者離散程度的不同說明其分?jǐn)?shù)分布的差異;,第二節(jié) 兩極差,一、概念,兩極差也稱全距,用符號(hào)R表示。所謂兩極差就是一組數(shù)據(jù)中最高值與最低值之差。,二、兩極差的求法,R=最大數(shù)值-最小數(shù)值,三、小結(jié):,1.兩極差是簡(jiǎn)單而粗略的差異量數(shù),2.不能反映中間數(shù)值的差異情況,也受兩極,端異常數(shù)值的影響。,3.可以作為數(shù)據(jù)分布的初步統(tǒng)計(jì),在一
4、定程度上反映數(shù)據(jù)的差異情況前提是分布比較對(duì)稱、沒有極端數(shù)值,第三節(jié) 四分差,一、概念,四分差指一個(gè)分布中,中間50%的次數(shù)的全距之半,用符號(hào)Q表示。,正如中數(shù)把一個(gè)次數(shù)分布分成兩半那樣,有一些點(diǎn)把一個(gè)次數(shù)分布分成四等份,這些點(diǎn)稱作四分點(diǎn)或四分位數(shù)。第一個(gè)四分點(diǎn)或稱下25分點(diǎn)用Q1表示,其下有全部數(shù)值的1/4或25%,其上那么有全部數(shù)值的3/4或75%,其上那么有全部數(shù)值的1/4或25%。,二.四分差的求法,要求四分差,首先要求Q1和Q3的值。對(duì)于分組數(shù)據(jù),用以下公式求之方法同中數(shù)的求法,其實(shí)中數(shù)就是第二個(gè)四分點(diǎn),式中Lb-該四分點(diǎn)所在組的精確下限;,fQ1,fQ3-該四分點(diǎn)所在組的次數(shù);,fb
5、-該四分點(diǎn)所在以下的累積次數(shù);,N-數(shù)據(jù)中的數(shù)值個(gè)數(shù);,i-組距,:N=100,i=5;,Q1的位置為N/4=25,即在1014組,該組的精確下限為9.5/,該組以下的累積次數(shù)(Fb為8;,我們下面以表,4.1,的分組數(shù)據(jù)未說明四分差的計(jì)算過程:,Q3的位置為3N/4=75,即在2529組,改組的精確下為24.5。該組以下的累積次數(shù)Fb)為72;,三、小結(jié),分差不受兩極端值的影響,故兩極差穩(wěn)定可靠,不能反映全部數(shù)據(jù)的差異情況,而且不適于代數(shù)運(yùn)算,適用于兩極端數(shù)據(jù)不清,無法計(jì)算其他差異量數(shù);,四分差常與中數(shù)結(jié)適宜用,第四節(jié) 平均差,一、概念,平均差:是指一組數(shù)據(jù)中各個(gè)數(shù)值與平均數(shù)之差的平均實(shí)質(zhì)上
6、是用數(shù)值離開平均數(shù)的距離來表示離散程度,一般用符號(hào)AD表示。,二、平均差的求法:,平均差是基于算術(shù)平均數(shù)上的一個(gè)差異量數(shù),而根據(jù)算術(shù)平均數(shù)的一個(gè)重要性質(zhì),一組數(shù)據(jù)中每個(gè)數(shù)值與算術(shù)平均數(shù)的差即離均差之和等于零即(),因此求平均差時(shí),要取離均差的絕對(duì)值。,對(duì)于未分組數(shù)據(jù),首先要計(jì)算每個(gè)數(shù)值的離均差,取其絕對(duì)值,然后把所有離均差相加,再除以數(shù)值的個(gè)數(shù)。公式表示如下:,例如10學(xué)生在一次完型填空練習(xí)中的得分為總分值20分,9,11,12,12,15,15,16,16,17,18,即以每組組中點(diǎn)代表該組各數(shù)值。首先計(jì)算組中點(diǎn)與平均數(shù)之差,取其絕對(duì)值,再乘以該組次數(shù),然后把各組的計(jì)算結(jié)果累加,最后除以總次
7、數(shù),N.,以表,4.2,中的數(shù)據(jù)為例,.,三、小結(jié),1.,平均差的優(yōu)點(diǎn),平均差優(yōu)于兩極差和四分差,用數(shù)值離開平均數(shù)數(shù)的平均距離來表示數(shù)據(jù)的分散程度,符合人們的常識(shí),易于理解和接受。,它的計(jì)算考慮了每一個(gè)數(shù)值,因而穩(wěn)定可靠,不易受極端數(shù)值的影響也不易受樣本變化的影響。,2.,缺點(diǎn),計(jì)算過程中需要取絕對(duì)值等原因,它不適合代數(shù)方法的運(yùn)算,因而在進(jìn)一步的統(tǒng)計(jì)分析中很少使用。,第五節(jié) 標(biāo)準(zhǔn)差與方差,一、概念,標(biāo)準(zhǔn)差是度量離中趨勢(shì)的最常用的差異量數(shù)。作為樣本統(tǒng)計(jì)量的標(biāo)準(zhǔn)差一般用符號(hào)S或者SD表示,而作為總體參數(shù)的標(biāo)準(zhǔn)那么用希臘字母。標(biāo)準(zhǔn)差的平方即為方差,分別用符號(hào)S2(樣本統(tǒng)計(jì)量和2總體參數(shù)來表示。,二、
8、標(biāo)準(zhǔn)差與方差的求法,下面就從未分組數(shù)據(jù)原始數(shù)據(jù)、次數(shù)分布數(shù)據(jù)和分組次數(shù)分布數(shù)據(jù)三個(gè)方面討論一下標(biāo)準(zhǔn)差和方差的計(jì)算方法。,1.未分組數(shù)據(jù)標(biāo)準(zhǔn)差和方差的求法,第一步:計(jì)算個(gè)數(shù)值與平均數(shù)之差離均差,第二步:求離均差的平方,第三步:把平方離均差相加,求平方和“;,第四步:把平方和除以數(shù)值的個(gè)數(shù),求得方差;,第五步:方差的平方根即為標(biāo)準(zhǔn)差。用公式表示:,顯然,由于涉及到平均數(shù),上述公式使用起來很不方便;我們可以在上述的公式的根底上得出一個(gè)不涉及平均數(shù)的求標(biāo)準(zhǔn)差的公式:,下面我們?nèi)杂蒙侠械臄?shù)據(jù)說明公式的用法,三個(gè)公式計(jì)算結(jié)果一樣,但計(jì)算過程要簡(jiǎn)便得多。,2.,次數(shù)分布數(shù)據(jù)標(biāo)準(zhǔn)差和方差的求法:,如果已有次
9、數(shù)分布表,那么標(biāo)準(zhǔn)差和方差的計(jì)算將更加簡(jiǎn)便。計(jì)算公式為:,3.,分組次數(shù)分布數(shù)據(jù)標(biāo)準(zhǔn)差和方差的求法,從分組次數(shù)分布數(shù)據(jù)標(biāo)準(zhǔn)差和方差的公式如下:,三、小結(jié),標(biāo)準(zhǔn)差與方差的概念易于理解,適于代數(shù)運(yùn)算,能反映所有數(shù)據(jù)的差異情況,不易受抽樣變動(dòng)的影響。,第六節(jié) 標(biāo)準(zhǔn)差的應(yīng)用,數(shù)據(jù)的標(biāo)準(zhǔn)化,標(biāo)準(zhǔn)差的重要應(yīng)用之一是對(duì)數(shù)值型數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化。在語言和語言教學(xué)研究中,標(biāo)準(zhǔn)化處理的主要用途是便于對(duì)考試分?jǐn)?shù)的比較。,一、考分比較,考分在各自分?jǐn)?shù)組中所處的相對(duì)位置是可以進(jìn)行比較的。雖然這同樣無法保證百分之百的可比性,但這至少為比較不同考試的分?jǐn)?shù)找到了一個(gè)較為可靠的途徑。,二、標(biāo)準(zhǔn)化與標(biāo)準(zhǔn)分,我們可以用公式表示這一標(biāo)準(zhǔn)
10、化過程:,該式表示:先從一個(gè)分?jǐn)?shù)中減去平均分,求出該分?jǐn)?shù)離開平均分的距離分?jǐn)?shù)低于平均數(shù)時(shí),差為負(fù)數(shù);反之為正數(shù),然后再除以標(biāo)準(zhǔn)差,即得標(biāo)準(zhǔn)分。,標(biāo)準(zhǔn)分具有以下幾個(gè)特點(diǎn):,三、標(biāo)準(zhǔn)分的應(yīng)用,通過把原始分?jǐn)?shù)轉(zhuǎn)換為標(biāo)準(zhǔn)分,原分?jǐn)?shù)不見了,而代之以一個(gè)抽象的相對(duì)位置標(biāo)準(zhǔn)分無實(shí)際單位,這樣就可以用同一把尺子來衡量和比較不同考試因而不同質(zhì)的分?jǐn)?shù)。,利用標(biāo)準(zhǔn)分,可以把不同質(zhì)的考試分?jǐn)?shù)合成求和或平均數(shù),然后再加以比較。,四、標(biāo)準(zhǔn)分與正態(tài)分布和百分位的關(guān)系,百分位是指把一組分?jǐn)?shù)從高到低排列并分為100等分,以百分位等級(jí)表示某個(gè)分?jǐn)?shù)在全局部數(shù)中所在的位置,即在全部考分仲有百分之幾的分?jǐn)?shù)是低于該分?jǐn)?shù)的或有百分之幾的分
11、數(shù)是高于該分?jǐn)?shù)的。,百分位表是在累計(jì)次數(shù)分布表的根底上編制的,標(biāo)準(zhǔn)分就是通過標(biāo)準(zhǔn)化把一個(gè)成呈正態(tài)分布的變量轉(zhuǎn)換成標(biāo)準(zhǔn)正態(tài)分布。在正態(tài)分布的情況下,分布曲線下任意兩個(gè)標(biāo)準(zhǔn)之間的面積、任一標(biāo)準(zhǔn)以上的買年紀(jì)或任一標(biāo)準(zhǔn)差以下的面積在總面積中的百分比都是一樣的。,總結(jié),離中趨勢(shì)指的是一組數(shù)據(jù)的變異或離散程度。對(duì)離中趨勢(shì)進(jìn)行度量的統(tǒng)計(jì)量稱作差異量數(shù)。離中趨勢(shì)的度量是描述統(tǒng)計(jì)的一個(gè)重要方面。,本章首先介紹了差異量數(shù)的作用:1.能從另一個(gè)角度了解數(shù)據(jù)的性質(zhì)。2.有助于檢驗(yàn)或說明集中量數(shù)的代表性。,其次重點(diǎn)介紹了差異量數(shù)的四種分類以及各種分類的求法,這四種分類分別是:1.兩極差;2.四分差;3.平均差;4.標(biāo)注差與方差。,最后論述了標(biāo)準(zhǔn)差的應(yīng)用數(shù)據(jù)的標(biāo)準(zhǔn)化。而數(shù)據(jù)的標(biāo)準(zhǔn)化主要是指對(duì)考試分?jǐn)?shù)的比較。,