《數(shù)理統(tǒng)計(jì)部分 方差分析與協(xié)方差分析 回歸方程 非參數(shù)統(tǒng)計(jì)PPT課件》由會(huì)員分享,可在線閱讀,更多相關(guān)《數(shù)理統(tǒng)計(jì)部分 方差分析與協(xié)方差分析 回歸方程 非參數(shù)統(tǒng)計(jì)PPT課件(54頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
1、專題一:方差分析與協(xié)方差分析專題一:方差分析與協(xié)方差分析1. 1. 單因素試驗(yàn)及有關(guān)的基本概念 在試驗(yàn)中,有可能影響試驗(yàn)指標(biāo)并且有可能加以控制的試驗(yàn)條件稱為因素。通過(guò)試驗(yàn)的設(shè)計(jì),在試驗(yàn)中只安排一個(gè)因素有所變化、取不同的狀態(tài)或水平,而其余的因素都在設(shè)計(jì)的狀態(tài)或水平下保持不變的試驗(yàn)稱為單因素試驗(yàn)。 一、單因素方差分析一、單因素方差分析第1頁(yè)/共54頁(yè) 可設(shè)單因素試驗(yàn)的因素為A,共有A1、A2、Ar等r個(gè)水平、分別安排了n1、n2、nr次重復(fù)試驗(yàn),其中的第i個(gè)水平Ai安排了ni次重復(fù)試驗(yàn),所得到的樣本為Xi1、Xi2、Xini,相應(yīng)的觀測(cè)值為xi1、xi2、xini,式中的n1+n2+nr= n。
2、水平水平 觀測(cè)值觀測(cè)值 A1 x11 x12 x1n1 A2 x21 x22 x2n2 Ar xr1 xr2 xrnr 第2頁(yè)/共54頁(yè),injijiixnx11設(shè)設(shè) riiirinjijxnnxnxi11111 在單因素試驗(yàn)中,假設(shè)有在單因素試驗(yàn)中,假設(shè)有r r個(gè)編號(hào)為個(gè)編號(hào)為i i1 1至至r r的正態(tài)總體,它們分別服從的正態(tài)總體,它們分別服從N(N(i i,2 2) )分布,分布, 第3頁(yè)/共54頁(yè)當(dāng)i及2未知時(shí),要根據(jù)取自這r個(gè)正態(tài)總體的r個(gè)相互獨(dú)立且方差相同的樣本檢驗(yàn)原假設(shè)H0:各i(i=1至r)相等,所作的檢驗(yàn)以及對(duì)未知參數(shù)的估計(jì)稱為方差分析。 稱為總平均值稱為總平均值 , ,第4
3、頁(yè)/共54頁(yè)總離均差平方和的分解總離均差平方和的分解對(duì)對(duì)總總平平均均值值考考慮慮全全體體樣樣本本觀觀測(cè)測(cè)值值ijx的離均差平方和的離均差平方和 ix,)( rinjijixxSST112,)(rinjijixxSSE112記記第5頁(yè)/共54頁(yè)結(jié)論結(jié)論1 1)SST=SSE+SSA; rinjijixxSST112)( rinjiiijixxxx112)()( rinjirinjiijiixxxx112112)()( rinjiiijixxxx112)(第6頁(yè)/共54頁(yè) rinjiiijixxxx11)(而而. )()(011 rinjiijiixxxx.SSASSESST第7頁(yè)/共54頁(yè)結(jié)論結(jié)
4、論2 2));(rnSSE22 結(jié)論結(jié)論3 3)當(dāng)H0為真時(shí), );(122rSSA 結(jié)論結(jié)論4 4)當(dāng)H0為真時(shí),SSE、SSA相互獨(dú)立; 第8頁(yè)/共54頁(yè)結(jié)論結(jié)論5 5)當(dāng)H0為真時(shí),時(shí),時(shí),rnSSEMSErSSAMSA,1),(rnrFMSEMSAF1.),(011HrnrFF時(shí)拒絕時(shí)拒絕當(dāng)當(dāng)?shù)?頁(yè)/共54頁(yè)2 單因素方差分析的計(jì)算單因素方差分析的計(jì)算 data ex;do a=1 to 3;input n ; do i=1 to n; input x ; Output;end;end; Cards; 8 21 29 24 22 25 30 27 26 10 20 25 25 23 2
5、9 31 24 26 20 21 6 24 22 28 25 21 26 ; proc anova; class a;model x=a; means a/duncan cldiff;run;第10頁(yè)/共54頁(yè) 例1.1切胚乳試驗(yàn)切胚乳試驗(yàn)用小麥種子進(jìn)行切胚乳試驗(yàn),設(shè)計(jì)分3種處理,同期播種在條件較為一致的花盆內(nèi),出苗后每盆選留2株,成熟后測(cè)量每株粒重(單位:g),得到數(shù)據(jù)如下: 處理處理 未切去胚乳未切去胚乳 切去一半胚乳切去一半胚乳 切去全部胚乳切去全部胚乳 每株粒重每株粒重 21,29,24,22,25,30,27,26 20,25,25,23,29,31,24,26,20,21 24,2
6、2,28,25,21,26第11頁(yè)/共54頁(yè)第12頁(yè)/共54頁(yè)方差來(lái)源 A 誤差 總和 平方和 6.77223.73230.50自由度 2 21 23均方和 3.39 10.65 F值 0.32顯著性 N第13頁(yè)/共54頁(yè) 例例1.21.2藥劑處理藥劑處理用用4 4種不同的藥劑處種不同的藥劑處理水稻種子,發(fā)芽后觀測(cè)到苗高理水稻種子,發(fā)芽后觀測(cè)到苗高( (單位:?jiǎn)挝唬篶m)cm)如下:如下: 處理處理 1 2 3 4 苗苗 高高 19, 23, 21, 13 21, 24, 27, 20 20, 18, 19, 15 22, 25, 27, 22第14頁(yè)/共54頁(yè)data ex;do a=1 t
7、o 3;do i=1 to 5 ;input x ;output;end;end;cards;19 23 21 13 21 24 27 20 20 18 19 15 22 25 27 22;proc anova; class a;model x=a;means a/duncan cldiff;run;第15頁(yè)/共54頁(yè)第16頁(yè)/共54頁(yè)方差來(lái)源 A 誤差 總和 平方和 104 118 222自由度 3 12 15均方和 34.67 9.83 F值 3.53顯著性 *第17頁(yè)/共54頁(yè)二、雙因素方差分析二、雙因素方差分析(一)不考慮交互作用的雙因素方差分析(一)不考慮交互作用的雙因素方差分析1.
8、理論理論 通過(guò)試驗(yàn)的設(shè)計(jì),在試驗(yàn)中只安排兩個(gè)因素有所變化、取不同的狀態(tài)或水平,而其他的因素都在設(shè)計(jì)的狀態(tài)或水平下保持不變的試驗(yàn)稱為雙因素試驗(yàn)。 第18頁(yè)/共54頁(yè) 可設(shè)雙因素試驗(yàn)的一個(gè)因素為A,共有A、A、A等r個(gè)水平,另一個(gè)因素為B,共有B、B、B等s個(gè)水平。 這兩個(gè)因素的水平互相搭配各安排一次試驗(yàn),其中A因素的A水平與B因素的B水平搭配安排試驗(yàn)所得到的樣本為X,相應(yīng)的觀測(cè)值為x 第19頁(yè)/共54頁(yè)2)(xxSSTijij2)(xxxxSSEjiijij2)(xxSSAiij2)(xxSSBjij第20頁(yè)/共54頁(yè)MSEMSBFB服從 F(s-1,(r-1)(s-1)分布 方差來(lái)源平方和自由
9、度均方和 F值顯著性 A B 誤差 總和 SSA SSB SSE SST r-1 s-1(r-1)(s-1) rs-1 MSA MSB MSE FA FBMSEMSAFA服從F(r-1,(r-1)(s-1)分布 第21頁(yè)/共54頁(yè)2.不考慮交互作用的雙因素方差分析的計(jì)算第22頁(yè)/共54頁(yè)data ex;do a=1 to 4;do b=1 to 5;input x ;output;end;end;cards;53 56 45 52 49 47 50 47 47 53 57 63 54 57 58 45 52 42 41 48;proc anova;class a b;model x=a b;m
10、eans a b/duncan cldiff;run;第23頁(yè)/共54頁(yè)第24頁(yè)/共54頁(yè)第25頁(yè)/共54頁(yè)(二)考慮交互作用的雙因素方差分析(二)考慮交互作用的雙因素方差分析 1.理論考慮交互作用的雙因素試驗(yàn) 可設(shè)雙因素試驗(yàn)的一個(gè)因素為A,共有A1、A2、Ar等r個(gè)水平,另一個(gè)因素為B, 共有B1、B2、Bs等s個(gè)水平。這兩個(gè)因素的水平互相搭配各安排m次試驗(yàn),其中A因 素的A水平與B因素的B水平搭配安排試驗(yàn)所得到的樣本為X,相應(yīng)的觀測(cè)值為x。第26頁(yè)/共54頁(yè)ijkjikxxSST2)(ijijkjikxxSSE2)(iijkxxSSA2)(ijjkxxSSB2)(ijijjikxxxxSS
11、AB2)(第27頁(yè)/共54頁(yè)MSEMSAFA服從F(r-1,rs(m-1)分布 MSEMSBFB服從 F(s-1,rs(m-1) )分布 MSEMSABFAB服從 F(r-1)(s-1),rs(m-1)分布 第28頁(yè)/共54頁(yè)方差來(lái)源平方和自由度均方和 F值顯著性 A B AB 誤差 總和 SSA SSBSSAB SSE SST r-1 s-1 (r-1)(s-1)rs(m-1) rsm-1 MSA MSB MSAB MSE FA FB FAB第29頁(yè)/共54頁(yè)考慮交互作用的雙因素方差分析第30頁(yè)/共54頁(yè)data ex;do a=1 to 4;do b=1 to 3;do i=1 to 2;
12、input x ;output;end;end;end;cards;58.2 52.6 56.2 41.2 65.3 60.849.1 42.8 54.1 50.5 51.6 48.4 60.1 58.3 70.9 73.2 39.2 40.775.8 71.5 58.2 51 48.7 41.4;proc anova;class a b;model x=a b a*b;means a b/duncan cldiff;run;第31頁(yè)/共54頁(yè)第32頁(yè)/共54頁(yè)第33頁(yè)/共54頁(yè) 統(tǒng)計(jì)控制的基本概念 如果在單因素、雙因素或多因素試驗(yàn)中有無(wú)法控制的因素x影響試驗(yàn)的結(jié)果Y,且x可以測(cè)量、x與Y之間
13、又有顯著的線性回歸時(shí),常常利用線性回歸來(lái)矯正Y的觀測(cè)值、消去x的差異對(duì)Y的影響。例如,研究施肥對(duì)蘋果樹(shù)產(chǎn)量的影響,由于蘋果樹(shù)的長(zhǎng)勢(shì)不齊,必須消去長(zhǎng)勢(shì)對(duì)產(chǎn)量的影響。又如,研究飼料對(duì)動(dòng)物增重的影響,由于動(dòng)物的初重不同,必須消去初重對(duì)增重的影響。這種不是在試驗(yàn)中控制某個(gè)因素,而是在試驗(yàn)后對(duì)該因素的影響進(jìn)行估計(jì),并對(duì)試驗(yàn)指標(biāo)的值作出調(diào)整的方法稱為統(tǒng)計(jì)控制,可以作為試驗(yàn)控制的輔助手段。以統(tǒng)計(jì)控制為目的,綜合線性回歸分析與方差分析所得到的統(tǒng)計(jì)分析方法,稱為協(xié)方差分析,所需要統(tǒng)計(jì)控制的一個(gè)或多個(gè)因素,例如蘋果樹(shù)的長(zhǎng)勢(shì),又如動(dòng)物的初重等等稱為協(xié)變量。第34頁(yè)/共54頁(yè)三、單因素協(xié)方差分析三、單因素協(xié)方差分析1
14、.理論理論第35頁(yè)/共54頁(yè)第36頁(yè)/共54頁(yè)第37頁(yè)/共54頁(yè)第38頁(yè)/共54頁(yè)第39頁(yè)/共54頁(yè)第40頁(yè)/共54頁(yè) 施用三種肥料的產(chǎn)量矯正后有極顯著的差異 第41頁(yè)/共54頁(yè) data ex; do a=1 to 3;do i=1 to 8; input x y ;output ;end;end; cards; 47 54 58 66 53 63 46 51 49 56 56 66 54 61 44 50 52 54 53 53 64 67 58 62 59 62 61 63 63 64 66 69 44 52 48 58 46 54 50 61 59 70 57 64 58 69 53
15、66 ; proc glm;class a;model y=x a/solution; lsmeans a/stderr pdiff;run;第42頁(yè)/共54頁(yè)第43頁(yè)/共54頁(yè)四、雙因素協(xié)方差分析 (一)不考慮交互作用的雙因素協(xié)方差分析 方差來(lái)源平方和自由度 均方和 F值 顯著性 A QA r-1 MQA FA B QB s-1 MQB FB 誤差 QErs-r-s MQE 總和 QT rs-2第44頁(yè)/共54頁(yè)第45頁(yè)/共54頁(yè) data ex;do a=1 to 3 ;do b=1 to 5 ;input x y ;output; end; end;cards;8 2.85 10 4.2
16、4 12 3.00 11 4.94 10 2.8810 3.14 12 4.50 7 2.75 12 5.84 10 4.0612 3.88 10 3.86 9 2.82 10 4.94 9 2.89;proc glm;class a b ;model y=x a b/solution;lsmeans a b/stderr pdiff;run;第46頁(yè)/共54頁(yè)第47頁(yè)/共54頁(yè) 方差來(lái)源平方和 自由度 均方和 F值 顯著性 A0.6046 2 0.3023 2.49 N B7.1245 4 1.7811 14.66 * 誤差0.8502 7 0.1215 總和8.5793 13各小區(qū)的產(chǎn)量矯
17、正后沒(méi)有顯著的差異,各品種的產(chǎn)量矯正后有極顯著的差異。第48頁(yè)/共54頁(yè)(一)考慮交互作用的雙因素協(xié)方差分析 方差來(lái)源平方和自由度 均方和 F值 顯著性 A QA r-1 MQA FA B QB s-1 MQB FB AB QAB(r-1)(s-1) MQAB FAB 誤差 QErs(m-1)-1 MQE 總和 QT rsm-2第49頁(yè)/共54頁(yè)第50頁(yè)/共54頁(yè) 方差來(lái)源 平方和自由度 均方和 F值顯著性 A277.43485 3 92.4782866.51 * B 2.845259 3 2.845259 0.20 N AB 12.848100 1 4.282700 0.30 N 誤差 99
18、.441171 7 14.205882 A與B的交互作用矯正后不顯著,促生長(zhǎng)劑之間的差異極顯著,試驗(yàn)批次間的差異不顯著 第51頁(yè)/共54頁(yè) data ex; do a=1 to 4; do b=1 to 2; do i=1 to 2;input x y ;output;end;end;end; cards; 14.6 97.8 12.1 94.2 19.5 113.2 18.8 110.1 13.6 100.3 12.9 98.5 18.5 119.4 18.2 114.7 12.8 99.2 10.7 89.618.2 122.2 16.9 105.3 12.0 102.1 12.4 103.8 16.4 117.2 17.2 117.9 proc glm; class a b;model y=x a b a*b/solution; lsmeans a b/stderr pdiff;run;第52頁(yè)/共54頁(yè)第53頁(yè)/共54頁(yè)感謝您的觀看。第54頁(yè)/共54頁(yè)