《多元回歸分析與協(xié)方差分析》由會(huì)員分享,可在線閱讀,更多相關(guān)《多元回歸分析與協(xié)方差分析(11頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
1、第章多元線性回歸分析,第節(jié)多元線性回歸分析的概述回歸分析中所涉及的變量常分為自變量與因變量。 當(dāng)因變量是非時(shí)間的連續(xù)性變量(自變量可包括連續(xù)性的和離散性的)時(shí),欲研究變量之間的依存關(guān)系,多元線性回歸分析是一個(gè)有力的研究工具。但從科學(xué)性角度來(lái)說(shuō),回歸問(wèn)題也應(yīng)從試驗(yàn)設(shè)計(jì)入手考慮。因?yàn)檫@樣做不僅可以減少回歸分析中可能遇到的很多麻煩,而且,可用較少的試驗(yàn)次數(shù)取得較多的信息。,多元線性回歸模型,Y=0+1X1+2X2+...+pXm+ 其中X1、X2、Xm為個(gè)自變量(即影響因素);0、1、2、m為+1個(gè)總體回歸參數(shù)(也稱為回歸系數(shù));為隨機(jī)誤差。當(dāng)研究者通過(guò)試驗(yàn)獲得了(X1,X2,,Xm,Y)的組樣本值
2、后, 運(yùn)用最小平方法便可求出上式中各總體回歸參數(shù)的估計(jì)值b0、b1、b2、bm,于是, 多元線性回歸模型變成了多元線性回歸方程式。Y=b0+b1X1+b2X2+...+bpXm,,,回歸分析的任務(wù),多元回歸分析的任務(wù)就是用數(shù)理統(tǒng)計(jì)法估計(jì)出各回歸參數(shù)的值及其標(biāo)準(zhǔn)誤差;對(duì)各回歸參數(shù)和整個(gè)回歸方程作假設(shè)檢驗(yàn);對(duì)各回歸變量(即自變量)的作用大小作出評(píng)價(jià);并利用已求得的回歸方程對(duì)因變量進(jìn)行預(yù)測(cè)、對(duì)自變量進(jìn)行控制等等。,標(biāo)準(zhǔn)回歸系數(shù)及其意義,因?yàn)楦鱞i的值受各變量單位的影響。為便于比較,需要求出標(biāo)準(zhǔn)化回歸系數(shù),消除僅由單位不同所帶來(lái)的差別。設(shè)與一般回歸系數(shù)bi對(duì)應(yīng)的標(biāo)準(zhǔn)化回歸系數(shù)為Bi,則Bi=biSXi
3、/SY 式中的SXi、SY分別為自變量Xi和Y的標(biāo)準(zhǔn)差。一般認(rèn)為標(biāo)準(zhǔn)化回歸系數(shù)的絕對(duì)值越大,所對(duì)應(yīng)的自變量對(duì)因變量的影響也就越大。但是,當(dāng)自變量彼此相關(guān)時(shí),回歸系數(shù)受模型中其他自變量的影響,解釋標(biāo)準(zhǔn)化回歸系數(shù)時(shí)必須采取謹(jǐn)慎的態(tài)度。當(dāng)然,更為妥善的辦法是通過(guò)回歸診斷,了解哪些自變量之間有嚴(yán)重的多重共線性,從而,舍去其中作用較小的變量, 使保留下來(lái)的所有自變量之間盡可能互相獨(dú)立。,自變量為定性變量的數(shù)量化法,設(shè)某定性變量有個(gè)水平(如ABO血型系統(tǒng)有個(gè)水平),若分別用、、、代表個(gè)水平的取值,是不夠合理的。因?yàn)檫@隱含著承認(rèn)各等級(jí)之間的間隔是相等的,其實(shí)質(zhì)是假定該因素的各水平對(duì)因變量的影響作用幾乎是相
4、同的。比較妥當(dāng)?shù)淖龇ㄊ且雮€(gè)啞變量(Dummy Variables),每個(gè)啞變量取值為或?,F(xiàn)以ABO血型系統(tǒng)為例,說(shuō)明產(chǎn)生啞變量的具體法。當(dāng)某人為A型血時(shí),令X1=1、X2=X3=0;當(dāng)某人為B型血時(shí),令X2=1、X1=X3=0;當(dāng)某人為AB型血時(shí),令X3=1、X1=X2=0;當(dāng)某人為O型血時(shí),令X1=X2=X3=0。,變量篩選,研究者根據(jù)專業(yè)知識(shí)和經(jīng)驗(yàn)所選定的全部自變量并非對(duì)因變量都是有顯著性影響的,故篩選變量是回歸分析中不可回避的問(wèn)題。然而,篩選變量的方法很多,詳見(jiàn)本章第節(jié),這里先介紹最常用的一種變量篩選法逐步篩選法。模型中的變量從無(wú)到有,根據(jù)F統(tǒng)計(jì)量按SLENTRY的值(選變量進(jìn)入方程的
5、顯著性水平)決定該變量是否入選;當(dāng)模型選入變量后,再根據(jù)F統(tǒng)計(jì)量按SLSTAY的值(將方程中的變量剔除出去的顯著性水平)剔除各不顯著的變量,依次類推。這樣直到?jīng)]有變量可入選,也沒(méi)有變量可剔除或入選變量就是剛剔除的變量,則停止逐步篩選過(guò)程。,回歸診斷,自變量之間如果有較強(qiáng)的相關(guān)關(guān)系,就很難求得較為理想的回歸方程;若個(gè)別觀測(cè)點(diǎn)與多數(shù)觀測(cè)點(diǎn)偏離很遠(yuǎn)或因過(guò)失誤差(如抄寫(xiě)或輸入錯(cuò)誤所致),它們也會(huì)對(duì)回歸方程的質(zhì)量產(chǎn)生極壞的影響。對(duì)這兩面的問(wèn)題進(jìn)行監(jiān)測(cè)和分析的法,稱為回歸診斷。前者屬于共線性診斷問(wèn)題;后者屬于異常點(diǎn)診斷問(wèn)題。,第章協(xié)方差分析,什么是協(xié)方差分析協(xié)方差分析是將回歸分析與方差分析結(jié)合起來(lái)使用的一
6、種分析法。在這種分析中,先將定量的影響因素(即難以控制的因素)看作自變量,或稱為協(xié)變量,建立因變量隨自變量變化的回歸方程,這樣就可以利用回歸方程把因變量的變化中受不易控制的定量因素的影響扣除掉,從而,能夠較合理地比較定性的影響因素處在不同水平下,經(jīng)過(guò)回歸分析手段修正以后的因變量的總體均數(shù)之間是否有顯著性的差別,這就是協(xié)方差分析解決問(wèn)題的基本思想。,協(xié)方差分析的模型,設(shè)定性的影響因素為A、B、C等,它們之間的交互作用為A*B、A*C等;定量的影響因素為X或X1、X2、;定量的觀測(cè)結(jié)果(即因變量)為Y,則有(1)單因素水平設(shè)計(jì)的協(xié)方差分析模型為MODEL Y=XA / SS3; (2)配伍組設(shè)計(jì)的協(xié)方差分析模型為MODEL Y=XAB/ SS3;(3)兩因素析因設(shè)計(jì)的協(xié)方差分析模型為MODEL Y=XABA*B/ SS3;,協(xié)方差分析的應(yīng)用條件,理論上要求各組資料都來(lái)自方差相同的正態(tài)總體;各組的總體直線回歸系數(shù)相等,且都不為。因此,嚴(yán)格地說(shuō),在對(duì)資料作協(xié)方差分析之前,應(yīng)先對(duì)這兩個(gè)前提條件作假設(shè)檢驗(yàn),若資料符合上述兩個(gè)條件,或經(jīng)變量變換后符合上述條件,方可進(jìn)行協(xié)方差分析。,例,看書(shū)上有關(guān)協(xié)方差分析的實(shí)例!,