回歸分析與協(xié)方差分析.ppt
《回歸分析與協(xié)方差分析.ppt》由會(huì)員分享,可在線閱讀,更多相關(guān)《回歸分析與協(xié)方差分析.ppt(50頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
回歸分析與協(xié)方差分析,內(nèi)容,,9.1一元線性回歸,學(xué)習(xí)目標(biāo),,散點(diǎn)圖,回歸系數(shù),正規(guī)方程,經(jīng)驗(yàn)回歸方程;回歸平方和,剩余平方和,相關(guān)系數(shù),顯著性檢驗(yàn).,不確定關(guān)系,人的身高,體重,農(nóng)作物的單位面積產(chǎn)量,施肥量,9.1一元線性回歸,1.一元線性回歸的基本概念,線性模型,例為了研究彈簧懸掛不同重量(單位:克力)x時(shí)長(zhǎng)度(單位:厘米)y的關(guān)系。通過(guò)試驗(yàn)得到一組數(shù)據(jù)。,重量xi51015202530長(zhǎng)度yj7.258.128.959.9010.9011.80,把這些數(shù)據(jù)點(diǎn)(xi,yj)畫在xoy坐標(biāo)系中,圖形稱為散點(diǎn)圖。,,,,*,*,*,*,*,*,L,散點(diǎn)圖,記L為,進(jìn)行n次獨(dú)立試驗(yàn),測(cè)得數(shù)據(jù)如下:,我們的問(wèn)題是,如何根據(jù)這些觀測(cè)值用“最佳的”形式來(lái)表達(dá)變量Y與X之間的相關(guān)關(guān)系?,一般而言,在變量x取值以后,若Y所取的值服從N(α+βx,σ2)分布,當(dāng)α、β及σ2未知時(shí),根據(jù)樣本(x1,Y1),(x2,Y2),…,(xn,Yn)的觀測(cè)值(x1,y1),(x2,y2),…,(xn,yn)對(duì)未知參數(shù)α、β及σ2所作的估計(jì)與檢驗(yàn)稱為一元線性回歸分析,而α稱為截距,β稱為回歸系數(shù),E(Y)=α+βx稱為回歸方程。,由回歸方程可以推出,根據(jù)樣本及其觀測(cè)值可以得到α、β及σ2的估計(jì)量及估計(jì)值,得到回歸方程的估計(jì)式或經(jīng)驗(yàn)回歸方程,最常用的是最小二乘法,即求出,的值最小,所求出的a稱為經(jīng)驗(yàn)截距,簡(jiǎn)稱為截距,b稱為經(jīng)驗(yàn)回歸系數(shù),簡(jiǎn)稱為回歸系數(shù),而,2.總體中未知參數(shù)的估計(jì),根據(jù)最小二乘法的要求由,得到一元線性回歸的正規(guī)方程組,并求出,建立一元線性回歸方程的具體步驟:,(3)計(jì)算b和a,寫出一元線性回歸方程。,與上述a和b相對(duì)應(yīng)的Q的數(shù)值又記作SSE,稱為剩余平方和。,將a、b和SSE以及和看作是統(tǒng)計(jì)量,它們的表達(dá)式分別為,這些統(tǒng)計(jì)量之間以及它們與總體參數(shù)之間有以下的內(nèi)在聯(lián)系:,①為提高a的估計(jì)精度,最理想的選擇是使=0,其絕對(duì)值越小越好;,②為提高b的估計(jì)精度,應(yīng)該使lxx取較大的數(shù)值,x1、x2、…、xn越分散越好;③觀測(cè)值的個(gè)數(shù)n不能太小。,3.線性回歸方程的顯著性檢驗(yàn),因此,必須對(duì)回歸方程的擬合情況或效果作顯著性檢驗(yàn)。,其理論基礎(chǔ)就是總平方和的分解,即,表示n個(gè)y1、y2、…、yn與之間的差異,當(dāng)各個(gè)yi已知時(shí),它是一個(gè)定值,稱為總平方和,記作SST。,通過(guò)回歸已經(jīng)達(dá)到了最小值,稱為剩余平方和,記作SSE。,稱為回歸平方和,記作SSR。,因此,SST=SSE+SSR。,如果SSR的數(shù)值較大,SSE的數(shù)值便比較小,說(shuō)明回歸的效果好;如果SSR的數(shù)值較小,SSE的數(shù)值便比較大,說(shuō)明回歸的效果差。,如果|r|較大,SSE的數(shù)值便比較小,說(shuō)明回歸的效果好或者說(shuō)x與Y的線性關(guān)系密切;如果|r|較小,SSE的數(shù)值便比較大,說(shuō)明回歸的效果差或者說(shuō)x與Y的線性關(guān)系不密切;因此稱r為x與Y的觀測(cè)值的相關(guān)系數(shù)。又由r及回歸系數(shù)的計(jì)算公式,可以推出:r>0時(shí)b>0,x增加時(shí)Y的觀測(cè)值呈增加的趨勢(shì);r0時(shí)稱x與Y正相關(guān),r<0時(shí)稱x與Y負(fù)相關(guān)。,綜上所述,如果設(shè)H0為β=0,也就是假設(shè)x與Y不是線性關(guān)系,則可以用以下三種實(shí)質(zhì)相同的方法檢驗(yàn)線性回歸方程的顯著性,且當(dāng)檢驗(yàn)的結(jié)果顯著時(shí)x與Y的線性關(guān)系顯著,回歸方程可供應(yīng)用;當(dāng)檢驗(yàn)的結(jié)果不顯著時(shí)x與Y的線性關(guān)系不顯著,回歸方程不可應(yīng)用。,⑴F檢驗(yàn)法:,,當(dāng)H0為真時(shí),,且SSR與SSE相互獨(dú)立;因此,當(dāng)H0為真時(shí),,當(dāng)F≥F1-α(1,n-2)時(shí)應(yīng)該放棄原假設(shè)H0。,(2)t檢驗(yàn)法:,當(dāng)H0為真時(shí),,當(dāng)|t|≥t1-0.5α(n-2)時(shí)應(yīng)該放棄原假設(shè)H0。,(3)r檢驗(yàn)法:,根據(jù)x與Y的觀測(cè)值的相關(guān)系數(shù),可以推出,當(dāng)H0為真時(shí),,當(dāng)F≥F1-α(1,n-2)或|r|≥rα(n-2)時(shí)應(yīng)該放棄原假設(shè)H0,式中的,,可由r檢驗(yàn)用表中查出。,因此,r常常用來(lái)表示x與Y的線性關(guān)系在x與Y的全部關(guān)系中所占的百分比,又稱為x與Y的觀測(cè)值的決定系數(shù)。,4.利用回歸方程進(jìn)行點(diǎn)預(yù)測(cè)和區(qū)間預(yù)測(cè),若線性回歸作顯著性檢驗(yàn)的結(jié)果是放棄H0,也就是放棄回歸系數(shù)β=0的假設(shè),便可以利用回歸方程進(jìn)行點(diǎn)預(yù)測(cè)和區(qū)間預(yù)測(cè),這是人們關(guān)注線性回歸的主要原因之一。,⑴當(dāng)x=x0時(shí),,Y0的觀測(cè)值y0的點(diǎn)預(yù)測(cè)是無(wú)偏的。,⑵當(dāng)x=x0時(shí),用適合不等式P{Y0∈(G,H)}≥1-α的統(tǒng)計(jì)量G和H所確定的隨機(jī)區(qū)間(G,H)預(yù)測(cè)Y0的取值范圍稱為區(qū)間預(yù)測(cè),而(G,H)稱為Y0的1-α預(yù)測(cè)區(qū)間。,若Y0與樣本中的各Yi相互獨(dú)立,則根據(jù)Z=Y(jié)0-(a+bx0)服從正態(tài)分布,E(Z)=0,,Z與SSE相互獨(dú)立,,可以導(dǎo)出,因此,Y0的1-α預(yù)測(cè)區(qū)間為a+bx0Δ(x0),,例1.1《吸附方程》某種物質(zhì)在不同溫度下可以吸附另一種物質(zhì),如果溫度x(單位:℃)與吸附重量Y(單位:mg)的觀測(cè)值如下表所示:,溫度x1.51.82.43.03.53.94.44.85.0,重量y4.85.77.08.310.912.413.113.615.3,試求線性回歸方程并用三種方法作顯著性檢驗(yàn),若x0=2,求Y0的0.95預(yù)測(cè)區(qū)間。,解:根據(jù)上述觀測(cè)值得到n=9,,所求的線性回歸方程為,顯著性檢驗(yàn)方法⑴F檢驗(yàn)法:SST=lyy=114.516,SSR=blxy=112.485,SSE=SST-blxy=2.031,n-2=7,F(xiàn)0.99(1,7)=12.2,,所以回歸方程極顯著;,⑵t檢驗(yàn)法:,,所以回歸方程極顯著;,(3)r檢驗(yàn)法:,所以回歸方程極顯著.,Y0的0.95預(yù)測(cè)區(qū)間為(4.09,8.15)。這說(shuō)明當(dāng)溫度為2時(shí),應(yīng)該預(yù)測(cè)吸附另一種物質(zhì)的重量在4.09至8.15之間,并且預(yù)測(cè)100次將有95次是正確的。,例1.2《植物保護(hù)》一些夏季害蟲(chóng)的盛發(fā)期與春季溫度有關(guān),現(xiàn)有1956-1964年間3月下旬至4月中旬旬平均溫度的累計(jì)數(shù)x和一代三化螟蛾盛發(fā)期Y(以5月10日為0)的觀測(cè)值如下:,溫度x35.534.131.740.336.840.231.739.244.2,盛發(fā)期y12169273139-1,試求線性回歸方程并用三種方法作顯著性檢驗(yàn),若x0=40,求Y0的0.95預(yù)測(cè)區(qū)間。,解:根據(jù)上述觀測(cè)值得到n=9,,所求的線性回歸方程為,顯著性檢驗(yàn)方法⑴F檢驗(yàn)法:SST=lyy=249.5556,SSR=blxy=174.8886,SSE=SST-blxy=74.6670,n-2=7,F(xiàn)0.99(1,7)=12.2,,所以回歸方程極顯著;,⑵t檢驗(yàn)法:,所以回歸方程極顯著;,(3)r檢驗(yàn)法:,所以回歸方程極顯著.,Y0的0.95預(yù)測(cè)區(qū)間為(-3.80,12.92)。,這說(shuō)明當(dāng)3月下旬至4月中旬旬平均溫度的累計(jì)數(shù)為40時(shí),應(yīng)該預(yù)測(cè)一代三化螟蛾盛發(fā)期為5月6日至5月23日之間,并且預(yù)測(cè)100次將有95次是正確的。,- 1.請(qǐng)仔細(xì)閱讀文檔,確保文檔完整性,對(duì)于不預(yù)覽、不比對(duì)內(nèi)容而直接下載帶來(lái)的問(wèn)題本站不予受理。
- 2.下載的文檔,不會(huì)出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請(qǐng)點(diǎn)此認(rèn)領(lǐng)!既往收益都?xì)w您。
下載文檔到電腦,查找使用更方便
9.9 積分
下載 |
- 配套講稿:
如PPT文件的首頁(yè)顯示word圖標(biāo),表示該P(yáng)PT已包含配套word講稿。雙擊word圖標(biāo)可打開(kāi)word文檔。
- 特殊限制:
部分文檔作品中含有的國(guó)旗、國(guó)徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計(jì)者僅對(duì)作品中獨(dú)創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 回歸 分析 協(xié)方差分析
鏈接地址:http://m.jqnhouse.com/p-11657221.html