《第一節(jié) 單因素試驗(yàn)的方差分析》由會(huì)員分享,可在線閱讀,更多相關(guān)《第一節(jié) 單因素試驗(yàn)的方差分析(7頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
1、第八章 方差分析與回歸分析
第一節(jié) 單因素試驗(yàn)的方差分析
在科學(xué)試驗(yàn)、生產(chǎn)實(shí)踐和社會(huì)生活中,影響一個(gè)事件的因素往往很多。例如,在工業(yè)生產(chǎn)中,產(chǎn)品的質(zhì)量往往受到原材料、設(shè)備、技術(shù)及員工素質(zhì)等因素的影響;又如,在工作中,影響個(gè)人收入的因素也是多方面的,除了學(xué)歷、專業(yè)、工作時(shí)間、性別等方面外,還受到個(gè)人能力、經(jīng)歷及機(jī)遇等偶然因素的影響. 雖然在這眾多因素中,每一個(gè)因素的改變都可能影響最終的結(jié)果,但有些因素影響較大,有些因素影響較小. 故在實(shí)際問(wèn)題中,就有必要找出對(duì)事件最終結(jié)果有顯著影響的那些因素. 方差分析就是根據(jù)試驗(yàn)的結(jié)果進(jìn)行分析,通過(guò)建立數(shù)學(xué)模型,鑒別各個(gè)因素影響效應(yīng)的一種有效方法
2、.
分布圖示
★ 引言 ★ 基本概念
★ 例1 ★ 例2
★ 假設(shè)前提 ★ 方差分析的任務(wù)
★ 偏差平方和及其分解
★ 和的統(tǒng)計(jì)特性
★ 檢驗(yàn)方法
★ 例3 ★ 例4
★ 習(xí)題8-1
內(nèi)容要點(diǎn)
一、基本概念
在方差分析中,我們將要考察的對(duì)象的某種特征稱為試驗(yàn)指標(biāo). 影響試驗(yàn)指標(biāo)的條件稱為因素. 因素可分為兩類,一類是人們可以控制的(如上例的原材料、設(shè)備、學(xué)歷、專業(yè)等因素);另
3、一類人們無(wú)法控制的(如上例中員工素質(zhì)與機(jī)遇等因素).
今后,我們所討論的因素都是指可控制因素。因素所處的狀態(tài),稱為該因素的水平. 如果在一項(xiàng)試驗(yàn)中只有一個(gè)因素在改變,則稱為單因素試驗(yàn);如果多于一個(gè)因素在改變,則稱為多因素試驗(yàn). 為方便起見(jiàn),今后用大寫字母等表示因素,用大寫字母加下標(biāo)表示該因素的水平,如等.
二、假設(shè)前提
設(shè)單因素A具有r個(gè)水平,分別記為在每個(gè)水平下,要考察的指標(biāo)可以看成一個(gè)總體,故有個(gè)總體,并假設(shè):
(1) 每個(gè)總體均服從正態(tài)分布;
(2) 每個(gè)總體的方差相同;
(3) 從每個(gè)總體中抽取的樣本相互獨(dú)立.
那么,要比較各個(gè)總體的均值是否一致,就是要檢驗(yàn)各個(gè)總
4、體的均值是否相等,設(shè)第個(gè)總體的均值為,則
假設(shè)檢驗(yàn)為
備擇假設(shè)為
通常備擇假設(shè)可以不寫.
在水平下,進(jìn)行次獨(dú)立試驗(yàn),得到試驗(yàn)數(shù)據(jù)為記數(shù)據(jù)的總個(gè)數(shù)為n =
由假設(shè)有 (和未知),即有~故可視為隨機(jī)誤差.記=,從而得到如下數(shù)學(xué)模型:
(1)
方差分析的任務(wù):
1) 檢驗(yàn)該模型中r個(gè)總體的均值是否相等;
2) 作出未知參數(shù), 的估計(jì).
為了更仔細(xì)地描述數(shù)據(jù),常在方差分析中引入總平均和效應(yīng)的概念. 稱各均值的加權(quán)平均
為總平均. 其中n= 再引入
表示在水平下總體的均值與總平均的差異,稱其為因子的第個(gè)水平的效應(yīng). 易見(jiàn),效應(yīng)間有如下關(guān)系式:
利用上述
5、記號(hào),前述數(shù)學(xué)模型可改寫為
(2)
而前述檢驗(yàn)假設(shè)則等價(jià)于:
三、偏差平方和及其分解
為了使造成各之間的差異的大小能定量表示出來(lái),我們先引入:
記在水平下數(shù)據(jù)和記為: ,其樣本均值為=因素A下的所
有水平的樣本總均值為
==,
為了通過(guò)分析對(duì)比產(chǎn)生樣本
, ,
之間差異性的原因,從而確定因素A的影響是否顯著,我們引入偏差平方和來(lái)度量各個(gè)體間的差異程度:
(3)
能反映全部試驗(yàn)數(shù)據(jù)之間的差異,又稱為總偏差平方和.
如果成立,則個(gè)總體間無(wú)顯著差異,也就是說(shuō)因素對(duì)指標(biāo)沒(méi)有顯著影響,所有的可以認(rèn)為來(lái)自同一個(gè)總體,各個(gè)間的差異只是由隨機(jī)因素引起的
6、。若不成立,則在總偏差中,除隨機(jī)因素引起的差異外,還包括由因素的不同水平的作用而產(chǎn)生的差異,如果不同水平作用產(chǎn)生的差異比隨機(jī)因素引起的差異大的多,就認(rèn)為因素對(duì)指標(biāo)有顯著影響,否則,認(rèn)為無(wú)顯著影響. 為此,可將總偏差中的這兩種差異分開(kāi),然后進(jìn)行比較。
記
(4)
其中
反映在每個(gè)水平下的樣本均值與樣本總均值的差異,它是由因素A取不同水平引起的,稱為組間(偏差)平方和,也稱為因素A的偏差平方和.
表示在水平下樣本值與該水平下的樣本均值之間的差異,它是由隨機(jī)誤差引起的,稱為誤差(偏差)平方和,也稱為組內(nèi)(偏差)平方和.
等式稱為平方和分解式. 事實(shí)上
7、 ==
=+
根據(jù)和的定義知
,
所以
==
四、與的統(tǒng)計(jì)特性
如果成立,則所有的都服從正態(tài)分布,且相互獨(dú)立,由第五章第三節(jié)的定理,可以證明:
1)
2) ~,且 所以為的無(wú)不偏估計(jì).
3) ~,且,因此為的無(wú)偏估計(jì).
4) 相互獨(dú)立.
五、檢驗(yàn)方法
如果組間差異比組內(nèi)差異大的多,即說(shuō)明因素的各水平間有顯著差異,個(gè)總體不能認(rèn)為是同一個(gè)正態(tài)總體,應(yīng)認(rèn)為不成立,此時(shí),比值有偏大的趨勢(shì). 為此,選用統(tǒng)計(jì)量
=
在為真時(shí),有
F =~ F
對(duì)給定的檢驗(yàn)水平,查的值,由樣本觀察值計(jì)算,,從而計(jì)算出統(tǒng)計(jì)量F的觀察值. 由于不
8、真時(shí),值偏大,導(dǎo)致F值偏大. 因此,
1) 若F>時(shí),拒絕,表示因素A的各水平下的效應(yīng)有顯著差異;
2) 若F<時(shí),則接受,表示因素A的各水平下的效應(yīng)無(wú)顯著差異.
實(shí)際分析中,常采用如下簡(jiǎn)便算法和記號(hào):
, =
=, =, =
為表達(dá)的方便和直觀,將上面的分析過(guò)程和結(jié)果制成一個(gè)表格,稱這個(gè)表為單因素方差分析表:
表8-1B單因素方差分析表
例題選講
例1 (E01) 設(shè)有三臺(tái)機(jī)器, 用來(lái)生產(chǎn)規(guī)格相同的鋁合金薄板.取樣, 測(cè)量薄板的厚度精確至千分之一厘米. 得結(jié)果如下表所示.
鋁合金板的厚度
機(jī)器Ⅰ
機(jī)器Ⅱ
機(jī)器Ⅲ
0.236
0.257
0.258
9、0.238
0.253
0.264
0.248
0.255
0.259
0.245
0.254
0.267
0.243
0.261
0.262
這里, 試驗(yàn)的指標(biāo)是薄板的厚度, 機(jī)器為因素, 不同的三臺(tái)機(jī)器就是這個(gè)因素的三個(gè)不同的水平. 如果假定除機(jī)器這一因素外, 材料的規(guī)格、操作人員的水平等其它條件都相同,這就是單因素試驗(yàn). 試驗(yàn)的目的是為了考察各臺(tái)機(jī)器所生產(chǎn)的薄板的厚度有無(wú)顯著的差異, 即考察機(jī)器這一因素對(duì)厚度有無(wú)顯著的影響. 如果厚度有顯著差異, 就表明機(jī)器這一因素對(duì)厚度的影響是顯著的.
例2 (E02) 某食品公司對(duì)一種食品設(shè)計(jì)了四種新包裝. 為了考察哪種
10、包裝最受歡迎, 選了十個(gè)有近似相同銷售量的商店作試驗(yàn), 其中兩種包裝各指定兩個(gè)商店銷售, 另兩種包裝各指定三個(gè)商店銷售. 在試驗(yàn)期中各商店的貨架排放位置、空間都盡量一致, 營(yíng)業(yè)員的促銷方法也基本相同. 觀察在一定時(shí)期的銷售量, 數(shù)據(jù)如下表所示:
銷售量
包裝
商店
商店數(shù)
1
2
3
12
18
2
14
12
13
3
19
17
21
3
24
30
2
在本例中, 我們要比較的是四種包裝的銷售量是否一致, 為此把包裝類型看成是一個(gè)因子, 記為因子A, 它有四種不同的包裝, 就看成是因子A的四個(gè)水平, 記為.一般將第種
11、包裝在第個(gè)商店的銷售量記為
(在本例中,).
由于商店間的差異已被控制在最小的范圍內(nèi), 因此一種包裝在不同商店里的銷售量被看作為一種包裝的若干次重復(fù)觀察, 所以可以把一種包裝看作一個(gè)總體. 為比較四種包裝的銷售量是否相同, 相當(dāng)于要比較的四個(gè)總體的均值是否一致. 簡(jiǎn)化起見(jiàn),需要給出若干假定,把所要回答的問(wèn)題歸結(jié)為下個(gè)統(tǒng)計(jì)問(wèn)題, 然后設(shè)法解決它.
例3 (E03) 在例1 中,檢驗(yàn)假設(shè)()
不全相等.
解 這里
的自由度依次為 得方差分析表如下:
方差來(lái)源
平方和
自由度
均方和
比
總和
12、0.00124533
14
因 故在水平下拒絕 認(rèn)為各臺(tái)機(jī)器生產(chǎn)的薄板厚度有顯著的差異.
例4 (E04) 在例2 中,檢驗(yàn)假設(shè)()
不全相等.
解 這里
的自由度依次為 得方差分析如下:
方差來(lái)源
平方和
自由度
均方和
F值
因素
誤差
258
46
3
6
86
7.67
總和
304
9
因 故在水平下拒絕, 即認(rèn)為四種包裝的銷售量有顯著差異, 這說(shuō)明不同包裝受歡迎的程度不同.