《多元回歸分析與協(xié)方差分析.ppt》由會員分享,可在線閱讀,更多相關《多元回歸分析與協(xié)方差分析.ppt(11頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、第章多元線性回歸分析,第節(jié)多元線性回歸分析的概述回歸分析中所涉及的變量常分為自變量與因變量。 當因變量是非時間的連續(xù)性變量(自變量可包括連續(xù)性的和離散性的)時,欲研究變量之間的依存關系,多元線性回歸分析是一個有力的研究工具。但從科學性角度來說,回歸問題也應從試驗設計入手考慮。因為這樣做不僅可以減少回歸分析中可能遇到的很多麻煩,而且,可用較少的試驗次數(shù)取得較多的信息。,多元線性回歸模型,Y=0+1X1+2X2+...+pXm+ 其中X1、X2、Xm為個自變量(即影響因素);0、1、2、m為+1個總體回歸參數(shù)(也稱為回歸系數(shù));為隨機誤差。當研究者通過試驗獲得了(X1,X2,,Xm,Y)的組樣本值
2、后, 運用最小平方法便可求出上式中各總體回歸參數(shù)的估計值b0、b1、b2、bm,于是, 多元線性回歸模型變成了多元線性回歸方程式。Y=b0+b1X1+b2X2+...+bpXm,,,回歸分析的任務,多元回歸分析的任務就是用數(shù)理統(tǒng)計法估計出各回歸參數(shù)的值及其標準誤差;對各回歸參數(shù)和整個回歸方程作假設檢驗;對各回歸變量(即自變量)的作用大小作出評價;并利用已求得的回歸方程對因變量進行預測、對自變量進行控制等等。,標準回歸系數(shù)及其意義,因為各bi的值受各變量單位的影響。為便于比較,需要求出標準化回歸系數(shù),消除僅由單位不同所帶來的差別。設與一般回歸系數(shù)bi對應的標準化回歸系數(shù)為Bi,則Bi=biSXi
3、/SY 式中的SXi、SY分別為自變量Xi和Y的標準差。一般認為標準化回歸系數(shù)的絕對值越大,所對應的自變量對因變量的影響也就越大。但是,當自變量彼此相關時,回歸系數(shù)受模型中其他自變量的影響,解釋標準化回歸系數(shù)時必須采取謹慎的態(tài)度。當然,更為妥善的辦法是通過回歸診斷,了解哪些自變量之間有嚴重的多重共線性,從而,舍去其中作用較小的變量, 使保留下來的所有自變量之間盡可能互相獨立。,自變量為定性變量的數(shù)量化法,設某定性變量有個水平(如ABO血型系統(tǒng)有個水平),若分別用、、、代表個水平的取值,是不夠合理的。因為這隱含著承認各等級之間的間隔是相等的,其實質(zhì)是假定該因素的各水平對因變量的影響作用幾乎是相
4、同的。比較妥當?shù)淖龇ㄊ且雮€啞變量(Dummy Variables),每個啞變量取值為或?,F(xiàn)以ABO血型系統(tǒng)為例,說明產(chǎn)生啞變量的具體法。當某人為A型血時,令X1=1、X2=X3=0;當某人為B型血時,令X2=1、X1=X3=0;當某人為AB型血時,令X3=1、X1=X2=0;當某人為O型血時,令X1=X2=X3=0。,變量篩選,研究者根據(jù)專業(yè)知識和經(jīng)驗所選定的全部自變量并非對因變量都是有顯著性影響的,故篩選變量是回歸分析中不可回避的問題。然而,篩選變量的方法很多,詳見本章第節(jié),這里先介紹最常用的一種變量篩選法逐步篩選法。模型中的變量從無到有,根據(jù)F統(tǒng)計量按SLENTRY的值(選變量進入方程的
5、顯著性水平)決定該變量是否入選;當模型選入變量后,再根據(jù)F統(tǒng)計量按SLSTAY的值(將方程中的變量剔除出去的顯著性水平)剔除各不顯著的變量,依次類推。這樣直到?jīng)]有變量可入選,也沒有變量可剔除或入選變量就是剛剔除的變量,則停止逐步篩選過程。,回歸診斷,自變量之間如果有較強的相關關系,就很難求得較為理想的回歸方程;若個別觀測點與多數(shù)觀測點偏離很遠或因過失誤差(如抄寫或輸入錯誤所致),它們也會對回歸方程的質(zhì)量產(chǎn)生極壞的影響。對這兩面的問題進行監(jiān)測和分析的法,稱為回歸診斷。前者屬于共線性診斷問題;后者屬于異常點診斷問題。,第章協(xié)方差分析,什么是協(xié)方差分析協(xié)方差分析是將回歸分析與方差分析結(jié)合起來使用的一
6、種分析法。在這種分析中,先將定量的影響因素(即難以控制的因素)看作自變量,或稱為協(xié)變量,建立因變量隨自變量變化的回歸方程,這樣就可以利用回歸方程把因變量的變化中受不易控制的定量因素的影響扣除掉,從而,能夠較合理地比較定性的影響因素處在不同水平下,經(jīng)過回歸分析手段修正以后的因變量的總體均數(shù)之間是否有顯著性的差別,這就是協(xié)方差分析解決問題的基本思想。,協(xié)方差分析的模型,設定性的影響因素為A、B、C等,它們之間的交互作用為A*B、A*C等;定量的影響因素為X或X1、X2、;定量的觀測結(jié)果(即因變量)為Y,則有(1)單因素水平設計的協(xié)方差分析模型為MODEL Y=XA / SS3; (2)配伍組設計的協(xié)方差分析模型為MODEL Y=XAB/ SS3;(3)兩因素析因設計的協(xié)方差分析模型為MODEL Y=XABA*B/ SS3;,協(xié)方差分析的應用條件,理論上要求各組資料都來自方差相同的正態(tài)總體;各組的總體直線回歸系數(shù)相等,且都不為。因此,嚴格地說,在對資料作協(xié)方差分析之前,應先對這兩個前提條件作假設檢驗,若資料符合上述兩個條件,或經(jīng)變量變換后符合上述條件,方可進行協(xié)方差分析。,例,看書上有關協(xié)方差分析的實例!,