最小二乘法OLS和線性回歸.ppt

上傳人：za****8 文檔編號：14777696 上傳時(shí)間：2020-07-30 格式：PPT 頁數(shù)：90 大?。?96.50KB

收藏版權(quán)申訴舉報(bào) 下載

第1頁 / 共90頁

第2頁 / 共90頁

第3頁 / 共90頁

下載文檔到電腦，查找使用更方便

14.9 積分

下載資源

還剩頁未讀，繼續(xù)閱讀

資源描述：

《最小二乘法OLS和線性回歸.ppt》由會員分享，可在線閱讀，更多相關(guān)《最小二乘法OLS和線性回歸.ppt（90頁珍藏版）》請?jiān)谘b配圖網(wǎng)上搜索。

1、1,第二章最小二乘法（OLS）和線性回歸模型,2,本章要點(diǎn),最小二乘法的基本原理和計(jì)算方法經(jīng)典線性回歸模型的基本假定 BLUE統(tǒng)計(jì)量的性質(zhì) t檢驗(yàn)和置信區(qū)間檢驗(yàn)的原理及步驟多變量模型的回歸系數(shù)的F檢驗(yàn) 預(yù)測的類型及評判預(yù)測的標(biāo)準(zhǔn) 好模型具有的特征,3,第一節(jié) 最小二乘法的基本屬性,一、有關(guān)回歸的基本介紹金融、經(jīng)濟(jì)變量之間的關(guān)系，大體上可以分為兩種：（1）函數(shù)關(guān)系：Y=f(X1,X2,.,XP)，其中Y的值是由Xi（i=1,2.p）所唯一確定的。（2）相關(guān)關(guān)系: Y=f(X1,X2,.,XP) ，這里Y的值不能由Xi（i=1,2.p）精確的唯一確定。,,,,4,圖2-1

2、貨幣供應(yīng)量和GDP散點(diǎn)圖,5,圖2-1表示的是我國貨幣供應(yīng)量M2（y）與經(jīng)過季節(jié)調(diào)整的GDP（x）之間的關(guān)系（數(shù)據(jù)為1995年第一季度到2004年第二季度的季度數(shù)據(jù)）。,6,但有時(shí)候我們想知道當(dāng)x變化一單位時(shí)，y平均變化多少，可以看到，由于圖中所有的點(diǎn)都相對的集中在圖中直線周圍，因此我們可以以這條直線大致代表x與y之間的關(guān)系。如果我們能夠確定這條直線，我們就可以用直線的斜率來表示當(dāng)x變化一單位時(shí)y的變化程度，由圖中的點(diǎn)確定線的過程就是回歸。,7,對于變量間的相關(guān)關(guān)系，我們可以根據(jù)大量的統(tǒng)計(jì)資料，找出它們在數(shù)量變化方面的規(guī)律（即“平均”的規(guī)律），這種統(tǒng)計(jì)規(guī)律所揭示的關(guān)系就是回歸關(guān)系（regre

3、ssive relationship）,所表示的數(shù)學(xué)方程就是回歸方程（regression equation）或回歸模型（regression model）。,8,圖2-1中的直線可表示為（2.1）,,,根據(jù)上式，在確定、的情況下，給定一個(gè)x值，我們就能夠得到一個(gè)確定的y值，然而根據(jù)式（2.1）得到的y值與實(shí)際的y值存在一個(gè)誤差（即圖2-1中點(diǎn)到直線的距離）。,9,如果我們以表示誤差，則方程（2.1）變?yōu)椋?,,即：,,其中t（=1,2,3,..,T）表示觀測數(shù)。,（2.2）,,（2.3）,式（2.3）即為一個(gè)簡單的雙變量回歸模型（因其僅具有兩個(gè)變量x, y）的基本

4、形式。,10,其中yt被稱作因變量（dependent variable）、被解釋變量（explained variable）、結(jié)果變量（effect variable）；,xt被稱作自變量（independent variable）、解釋變量（explanatory variable）、原因變量（causal variable）,11,、為參數(shù)（parameters）,或稱回歸系數(shù)（regression coefficients）； t通常被稱為隨機(jī)誤差項(xiàng)（stochastic error term）,或隨機(jī)擾動項(xiàng)（random disturbance term）,簡

5、稱誤差項(xiàng)，在回歸模型中它是不確定的，服從隨機(jī)分布（相應(yīng)的，yt也是不確定的，服從隨機(jī)分布）。,12,為什么將t 包含在模型中？（1）有些變量是觀測不到的或者是無法度量的，又或者影響因變量yt的因素太多；（2）在yt的度量過程中會發(fā)生偏誤，這些偏誤在模型中是表示不出來的；（3）外界隨機(jī)因素對yt的影響也很難模型化，比如：恐怖事件、自然災(zāi)害、設(shè)備故障等。,13,二、參數(shù)的最小二乘估計(jì) (一) 方法介紹本章所介紹的是普通最小二乘法（ordinary least squares,簡記OLS）; 最小二乘法的基本原則是：最優(yōu)擬合直線應(yīng)該使各點(diǎn)到直線的距離的和最小，也可表述為距離的平方和最小。

6、假定根據(jù)這一原理得到的、估計(jì)值為、，則直線可表示為。,14,直線上的yt值，記為，稱為擬合值（fitted value）,實(shí)際值與擬合值的差，記為，稱為殘差（residual），可以看作是隨機(jī)誤差項(xiàng) 的估計(jì)值。根據(jù)OLS的基本原則，使直線與各散點(diǎn)的距離的平方和最小，實(shí)際上是使殘差平方和（residual sum of squares, 簡記RSS）最小，即最小化：,,,,,,,RSS= = （2.4）,15,根據(jù)最小化的一階條件，將式2.4分別對、求偏導(dǎo)，并令其為零，即可求得結(jié)果如下 :,,,（2.5）,（2.6）,16,（二）一些基本概念 1

7、.總體（the population）和樣本（the sample）總體是指待研究變量的所有數(shù)據(jù)集合，可以是有限的，也可以是無限的；而樣本是總體的一個(gè)子集。 2、總體回歸方程（the population regression function，簡記PRF），樣本回歸方程（the sample regression function，簡記SRF）。,17,總體回歸方程（PRF）表示變量之間的真實(shí)關(guān)系，有時(shí)也被稱為數(shù)據(jù)生成過程（DGP），PRF中的、值是真實(shí)值，方程為：,,+,,（2. 7）,樣本回歸方程（SRF）是根據(jù)所選樣本估算的變量之間的關(guān)系函數(shù)，方程為：,注意：SRF中沒有誤差項(xiàng)，根據(jù)

8、這一方程得到的是總體因變量的期望值,（2.8）,18,于是方程（2.7）可以寫為：（2.9）總體y值被分解為兩部分：模型擬合值（）和殘差項(xiàng)（）。,,,19,3.線性關(guān)系對線性的第一種解釋是指：y是x的線性函數(shù)，比如，y= 。對線性的第二種解釋是指：y是參數(shù)的一個(gè)線性函數(shù)，它可以不是變量x的線性函數(shù)。比如，y= 就是一個(gè)線性回歸模型，但則不是。在本課程中，線性回歸一詞總是對指參數(shù)為線性的一種回歸（即參數(shù)只以一次方出現(xiàn)），對解釋變量x則可以是或不是線性的。,,,,20,有些模型看起來不是線性回歸，但經(jīng)過一些基本代數(shù)變換可以轉(zhuǎn)

9、換成線性回歸模型。例如，,,（2.10）,可以進(jìn)行如下變換：,,（2.11）,令、、，則方程（2. 11）變?yōu)椋?（2.12）,可以看到，模型2.12即為一線性模型。,21,4.估計(jì)量（estimator）和估計(jì)值（estimate）估計(jì)量是指計(jì)算系數(shù)的方程；而估計(jì)值是指估計(jì)出來的系數(shù)的數(shù)值。,22,三、最小二乘估計(jì)量的性質(zhì)和分布（一）經(jīng)典線性回歸模型的基本假設(shè) （1），即殘差具有零均值；（2）var <,即殘差具有常數(shù)方差，且對于所有x值是有限的；（3）cov ，即殘差項(xiàng)之間在統(tǒng)計(jì)意義上是相互獨(dú)立的；（4）cov ，即殘差項(xiàng)與變量

10、x無關(guān)；（5）tN ,即殘差項(xiàng)服從正態(tài)分布,23,（二）最小二乘估計(jì)量的性質(zhì) 如果滿足假設(shè)(1)(4)，由最小二乘法得到的估計(jì)量、具有一些特性，它們是最優(yōu)線性無偏估計(jì)量（Best Linear Unbiased Estimators，簡記BLUE）。,,,,,,24,估計(jì)量（estimator）：意味著、是包含著真實(shí)、值的估計(jì)量；線性（linear）：意味著、與隨機(jī)變量y之間是線性函數(shù)關(guān)系；無偏（unbiased）：意味著平均而言，實(shí)際得到的、值與其真實(shí)值是一致的；最優(yōu)（best）：意味著在所有線性無偏估計(jì)量里，OLS估計(jì)量具有最小方差。,,,,,,25,(

11、三) OLS估計(jì)量的方差、標(biāo)準(zhǔn)差和其概率分布 1.OLS估計(jì)量的方差、標(biāo)準(zhǔn)差。給定假設(shè)(1)(4)，估計(jì)量的標(biāo)準(zhǔn)差計(jì)算方程如下 :,,,其中，是殘差的估計(jì)標(biāo)準(zhǔn)差。,（2.21）,（2.22）,26,參數(shù)估計(jì)量的標(biāo)準(zhǔn)差具有如下的性質(zhì)：（1）樣本容量T越大，參數(shù)估計(jì)值的標(biāo)準(zhǔn)差越小；（2）和都取決于s2。 s2是殘差的方差估計(jì)量。 s2越大，殘差的分布就越分散，這樣模型的不確定性也就越大。如果s2很大，這意味著估計(jì)直線不能很好地?cái)M合散點(diǎn)；,,,27,（3）參數(shù)估計(jì)值的方差與成反比。其值越小，散點(diǎn)越集中，這樣就越難準(zhǔn)確地估計(jì)擬合直線；相反，如果越大，散點(diǎn)越分

12、散，這樣就可以容易地估計(jì)出擬合直線，并且可信度也大得多。比較圖22就可以清楚地看到這點(diǎn)。,,,28,圖22 直線擬合和散點(diǎn)集中度的關(guān)系,29,（4）項(xiàng)只影響截距的標(biāo)準(zhǔn)差，不影響斜率的標(biāo)準(zhǔn)差。理由是：衡量的是散點(diǎn)與y軸的距離。越大，散點(diǎn)離y軸越遠(yuǎn)，就越難準(zhǔn)確地估計(jì)出擬合直線與y軸的交點(diǎn)（即截距）；反之，則相反。,,,,30,2OLS估計(jì)量的概率分布給定假設(shè)條件(5)，即，則也服從正態(tài)分布系數(shù)估計(jì)量也是服從正態(tài)分布的：,,,,,（2.30）,,,（2.31）,31,需要注意的是：如果殘差不服從正態(tài)分布，即假設(shè)(5)不成立，但只要CLRM的其他假設(shè)條件還成立，且樣本容量足

13、夠大，則通常認(rèn)為系數(shù)估計(jì)量還是服從正態(tài)分布的。,其標(biāo)準(zhǔn)正態(tài)分布為：,（2.32）,（2.33）,32,但是，總體回歸方程中的系數(shù)的真實(shí)標(biāo)準(zhǔn)差是得不到的，只能得到樣本的系數(shù)標(biāo)準(zhǔn)差（、）。用樣本的標(biāo)準(zhǔn)差去替代總體標(biāo)準(zhǔn)差會產(chǎn)生不確定性，并且,,,、將不再服從正態(tài)分布，而服從自由度為T-2的t分布，其中T為樣本容量,,,,即：, (2.34),,(2.35),33,3.正態(tài)分布和t分布的關(guān)系,圖2-3 正態(tài)分布和t分布形狀比較,,34,從圖形上來看，t分布的尾比較厚，均值處的最大值小于正態(tài)分布。隨著t分布自由度的增大，其對應(yīng)臨界值顯著減小，當(dāng)自由度趨向于無窮時(shí)，t分布就服從標(biāo)準(zhǔn)

14、正態(tài)分布了。所以正態(tài)分布可以看作是t分布的一個(gè)特例。,35,第二節(jié) 一元線性回歸模型的統(tǒng)計(jì)檢驗(yàn),一、擬合優(yōu)度(goodness of fit statistics)檢驗(yàn) 擬合優(yōu)度可用R2 表示：模型所要解釋的是y相對于其均值的波動性，即（總平方和，the total sum of squares，簡記TSS），這一平方和可以分成兩部分：,,,36,= + （2.36）,,,,是被模型所解釋的部分，稱為回歸平方和（the explained sum of squares，簡記ESS）；是不能被模型所解釋的殘差平方和（RSS）,即 =,,,,,37

15、,TSS、ESS、RSS的關(guān)系以下圖來表示更加直觀一些：,圖24 TSS、ESS、RSS的關(guān)系,38,擬合優(yōu)度因?yàn)?TSS=ESS+RSS 所以 R2 （2.39）,,,（2.37）,（2.38）,,,,,R2越大，說明回歸線擬合程度越好；R2越小，說明回歸線擬合程度越差。由上可知，通過考察R2的大小，我們就能粗略地看出回歸線的優(yōu)劣。,39,但是，R2作為擬合優(yōu)度的一個(gè)衡量標(biāo)準(zhǔn)也存在一些問題：（1）如果模型被重新組合，被解釋變量發(fā)生了變化，那么R2也將隨之改變，因此具有不同被解釋變量的模型之間是無法來比較R2的大小的。,40,（2）增加了一個(gè)解釋變量以后， R2只會增大

16、而不會減小，除非增加的那個(gè)解釋變量之前的系數(shù)為零，但在通常情況下該系數(shù)是不為零的，因此只要增加解釋變量， R2就會不斷的增大，這樣我們就無法判斷出這些解釋變量是否應(yīng)該包含在模型中。（3）R2的值經(jīng)常會很高，達(dá)到0.9或更高，所以我們無法判斷模型之間到底孰優(yōu)孰劣。,41,為了解決上面第二個(gè)問題，我們通常用調(diào)整過的R2來代替未調(diào)整過的R2 。對R2進(jìn)行調(diào)整主要是考慮到在引進(jìn)一個(gè)解釋變量時(shí)，會失去相應(yīng)的自由度。調(diào)整過的R2用來表示，公式為：其中T為樣本容量，K為自變量個(gè)數(shù),,,（2.40）,42,二、假設(shè)檢驗(yàn) 假設(shè)檢驗(yàn)的基本任務(wù)是根據(jù)樣本所提供的信息，對未知總體分布某些方面的假設(shè)做

17、出合理解釋假設(shè)檢驗(yàn)的程序是，先根據(jù)實(shí)際問題的要求提出一個(gè)論斷，稱為零假設(shè)（null hypothesis）或原假設(shè)，記為H0（一般并列的有一個(gè)備擇假設(shè)（alternative hypothesis）,記為H1 ）然后根據(jù)樣本的有關(guān)信息，對H0的真?zhèn)芜M(jìn)行判斷，做出拒絕H0或不能拒絕H0的決策。,43,假設(shè)檢驗(yàn)的基本思想是概率性質(zhì)的反證法。概率性質(zhì)的反證法的根據(jù)是小概率事件原理。該原理認(rèn)為“小概率事件在一次實(shí)驗(yàn)中幾乎是不可能發(fā)生的”。在原假設(shè)H0下構(gòu)造一個(gè)事件（即檢驗(yàn)統(tǒng)計(jì)量），這個(gè)事件在“原假設(shè)H0是正確的”的條件下是一個(gè)小概率事件，如果該事件發(fā)生了，說明“原假設(shè)H0是正確的”是錯誤的，因?yàn)?/p>

18、不應(yīng)該出現(xiàn)的小概率事件出現(xiàn)了，應(yīng)該拒絕原假設(shè)H0 。,44,假設(shè)檢驗(yàn)有兩種方法：置信區(qū)間檢驗(yàn)法（confidence interval approach）和顯著性檢驗(yàn)法（test of significance approach）。顯著性檢驗(yàn)法中最常用的是t檢驗(yàn)和F檢驗(yàn)，前者是對單個(gè)變量系數(shù)的顯著性檢驗(yàn)，后者是對多個(gè)變量系數(shù)的聯(lián)合顯著性檢驗(yàn)。,45,（一）t檢驗(yàn) 下面我們具體介紹對方程（2.3）的系數(shù)進(jìn)行t檢驗(yàn)的主要步驟。（1）用OLS方法回歸方程（2.3），得到的估計(jì)值及其標(biāo)準(zhǔn)差。（2）假定我們建立的零假設(shè)是：，備則假設(shè)是（這是一個(gè)雙側(cè)檢驗(yàn))。,,,,,46,

19、則我們建立的統(tǒng)計(jì)量服從自由度為T-2的t分布。,,（3）選擇一個(gè)顯著性水平（通常是5%）,我們就可以在t分布中確定拒絕區(qū)域和非拒絕區(qū)域，如圖2-5。如果選擇顯著性水平為5%，則表明有5%的分布將落在拒絕區(qū)域,47,圖2-5 雙側(cè)檢驗(yàn)拒絕區(qū)域和非拒絕區(qū)域分布,48,（4）選定顯著性水平后，我們就可以根據(jù)t分布表求得自由度為T-2的臨界值，當(dāng)檢驗(yàn)統(tǒng)計(jì)值的絕對值大于臨界值時(shí)，它就落在拒絕區(qū)域，因此我們拒絕的原假設(shè)，而接受備則假設(shè)。反之則相反。可以看到，t檢驗(yàn)的基本原理是如果參數(shù)的假設(shè)值與估計(jì)值差別很大，就會導(dǎo)致小概率事件的發(fā)生，從而導(dǎo)致我們拒絕參數(shù)的假設(shè)值。,49,(二）置信區(qū)間法仍

20、以方程2.3的系數(shù)為例，置信區(qū)間法的基本思想是建立圍繞估計(jì)值的一定的限制范圍，推斷總體參數(shù)是否在一定的置信度下落在此區(qū)間范圍內(nèi)。,置信區(qū)間檢驗(yàn)的主要步驟（所建立的零假設(shè)同 t檢驗(yàn)）。,,50,（1）用OLS法回歸方程（2.3），得到的估計(jì)值及其標(biāo)準(zhǔn)差。（2）選擇一個(gè)顯著性水平（通常為5%），這相當(dāng)于選擇95%的置信度。查t分布表，獲得自由度為T-2的臨界值。（3）所建立的置信區(qū)間為（，）（2.41）,,,,,,,,51,（4）如果零假設(shè)值落在置信區(qū)間外，我們就拒絕的原假設(shè)；反之，則不能拒絕。需要注意的是，置信區(qū)間檢驗(yàn)都是雙側(cè)檢驗(yàn)，盡管在

21、理論上建立單側(cè)檢驗(yàn)也是可行的。,,,52,（三）t檢驗(yàn)與置信區(qū)間檢驗(yàn)的關(guān)系,在顯著性檢驗(yàn)法下，當(dāng) 的絕對值小于臨界值時(shí)，即：（2.42）時(shí)，我們不能拒絕原假設(shè)。對式（2.41）變形，我們可以得到：（2.43）可以看到，式（2.43）恰好是置信區(qū)間法的置信區(qū)間式（2.41），因此，實(shí)際上t檢驗(yàn)法與置信區(qū)間法提供的結(jié)果是完全一樣的。,,,,,,,,53,（四）第一類錯誤和第二類錯誤,如果有一個(gè)零假設(shè)在5的顯著性水平下被拒絕了，有可能這個(gè)拒絕是不正確的，這種錯誤被稱為第一類錯誤，它發(fā)生的概率為5。另

22、外一種情況是，我們得到95的一個(gè)置信區(qū)間，落在這個(gè)區(qū)間的零假設(shè)我們都不能拒絕，當(dāng)我們接受一個(gè)零假設(shè)的時(shí)候也可能犯錯誤，因?yàn)榛貧w系數(shù)的真實(shí)值可能是該區(qū)間內(nèi)的另外一個(gè)值，這一錯誤被稱為第二類錯誤。在選擇顯著性水平時(shí)人們面臨抉擇：降低犯第一類錯誤的概率就會增加犯第二類錯誤的概率。,54,（五）P值 P值是計(jì)量經(jīng)濟(jì)結(jié)果對應(yīng)的精確的顯著性水平。 P值度量的是犯第一類錯誤的概率，即拒絕正確的零假設(shè)的概率。P值越大，錯誤地拒絕零假設(shè)的可能性就越大；p值越小，拒絕零假設(shè)時(shí)就越放心。現(xiàn)在許多統(tǒng)計(jì)軟件都能計(jì)算各種統(tǒng)計(jì)量的p值，如Eviews、Stata等。,55,第三節(jié) 多變量線性回歸模型的統(tǒng)計(jì)檢驗(yàn),一、多變量

23、模型的簡單介紹考察下面這個(gè)方程： t=1,2,3.T (2.44) 對y產(chǎn)生影響的解釋變量共有k-1（x2t,x3t,xkt）個(gè)，系數(shù)（12..k）分別衡量了解釋變量對因變量y的邊際影響的程度。,,56,方程（2.44）的矩陣形式為這里：y是T1矩陣，X是Tk矩陣，是k1矩陣，u是T1矩陣,,（2.46）,57,在多變量回歸中殘差向量為：,,（2.47）,殘差平方和為：,,（2.48）,58,可以得到多變量回歸系數(shù)的估計(jì)表達(dá)式,,（2.49）,同樣我們可以得到多變量回歸模型殘差的樣本方差,,（2.50）,參數(shù)的協(xié)方差矩陣

24、（2.51）,59,二、擬合優(yōu)度檢驗(yàn) 在多變量模型中，我們想知道解釋變量一起對因變量y變動的解釋程度。我們將度量這個(gè)信息的量稱為多元判定系數(shù)R2。在多變量模型中，下面這個(gè)等式也成立： TSS=ESS+RSS （2.52）其中，TSS為總離差平方和；ESS為回歸平方和；RSS為殘差平方和。,60,與雙變量模型類似，定義如下：即，R2是回歸平方和與總離差平方和的比值；與雙變量模型唯一不同的是，ESS值與多個(gè)解釋變量有關(guān)。 R2的值在0與1之間，越接近于1，說明估計(jì)的回歸直線擬合得越好。,,,（2.53）,61,可以證明：（2.54）因此，

25、（2.55）,,,62,三、假設(shè)檢驗(yàn) （一）、t檢驗(yàn) 在多元回歸模型中，t統(tǒng)計(jì)量為：,,,,,（2.56）,均服從自由度為（n-k）的t分布。下面的檢驗(yàn)過程跟雙變量線性回歸模型的檢驗(yàn)過程一樣。,63,（二）、F檢驗(yàn) F檢驗(yàn)的第一個(gè)用途是對所有的回歸系數(shù)全為0的零假設(shè)的檢驗(yàn)。第二個(gè)用途是用來檢驗(yàn)有關(guān)部分回歸系數(shù)的聯(lián)合檢驗(yàn)，就方法而言，兩種用途是完全沒有差別的，下面我們將以第二個(gè)用途為例，對F檢驗(yàn)進(jìn)行介紹。,64,為了解聯(lián)合檢驗(yàn)是如何進(jìn)行的，考慮如下多元回歸模型：,,（2.57）,這個(gè)模型稱為無約束回歸模型（unrestricted regression），因?yàn)殛P(guān)于回歸系數(shù)

26、沒有任何限制。,65,假設(shè)我們想檢驗(yàn)其中q個(gè)回歸系數(shù)是否同時(shí)為零，為此改寫公式（2.57），將所有變量分為兩組，第一組包含k-q個(gè)變量（包括常項(xiàng)），第二組包含q個(gè)變量：,,（2.58）,66,如果假定所有后q個(gè)系數(shù)都為零，即建立零假設(shè)：，則修正的模型將變?yōu)橛屑s束回歸模型（restricted regression）（零系數(shù)條件）：,,,（2.59）,67,關(guān)于上述零假設(shè)的檢驗(yàn)很簡單。若從模型中去掉這q個(gè)變量，對有約束回歸方程（2.59）進(jìn)行估計(jì)的話，得到的誤差平方和肯定會比相應(yīng)的無約束回歸方程的誤差平方和大。如果零假設(shè)正確，去掉這q個(gè)變量對方程的解釋能力影響不大。當(dāng)然，零假

27、設(shè)的檢驗(yàn)依賴于限制條件的數(shù)目，即被設(shè)定為零的系數(shù)個(gè)數(shù)，以及無約束回歸模型的自由度。,,,68,檢驗(yàn)的統(tǒng)計(jì)量為：,（2.60）,在這里，分子是誤差平方和的增加與零假設(shè)所隱含的參數(shù)限制條件的個(gè)數(shù)之比；分母是模型的誤差平方和與無條件模型的自由度之比。如果零假設(shè)為真，式（2.60）中的統(tǒng)計(jì)量將服從分子自由度為q，分母自由度為N-K的F分布。,69,對回歸系數(shù)的子集的F檢驗(yàn)與對整個(gè)回歸方程的F檢驗(yàn)做法一樣。選定顯著性水平，比如1或5，然后將檢驗(yàn)統(tǒng)計(jì)量的值與F分布的臨界值進(jìn)行比較。如果統(tǒng)計(jì)量的值大于臨界值，我們拒絕零假設(shè)，認(rèn)為這組變量在統(tǒng)計(jì)上是顯著的。一般的原則是，必須對兩個(gè)方程分別進(jìn)行估計(jì)，以便正確地運(yùn)

28、用這種F檢驗(yàn)。,70,F檢驗(yàn)與R2有密切的聯(lián)系。回想 ,則，（2.61）兩個(gè)統(tǒng)計(jì)量具有相同的因變量，因此將上面的兩個(gè)方程代入（2.60），檢驗(yàn)的統(tǒng)計(jì)量可以寫成：,,,,,,（2.62）,71,第四節(jié) 預(yù)測,一、預(yù)測的概念和類型（一）預(yù)測的概念金融計(jì)量學(xué)中，所謂預(yù)測就是根據(jù)金融經(jīng)濟(jì)變量的過去和現(xiàn)在的發(fā)展規(guī)律，借助計(jì)量模型對其未來的發(fā)展趨勢和狀況進(jìn)行描述、分析，形成科學(xué)的假設(shè)和判斷。,72,（二）預(yù)測原理條件期望（conditional expectations），在t期Y的t+1期的條件期望值記作，它表示的是在所有已知的t期的信息的條件下

29、，Y在t+1期的期望值。假定在t期，我們要對因變量Y的下一期（即t+1期）值進(jìn)行預(yù)測，則記作。,,,73,在t期對Y的下一期的所有預(yù)測值中，Y的條件期望值是最優(yōu)的（即具有最小方差），因此，我們有：,,（2.65）,74,（三）預(yù)測的類型：（1）無條件預(yù)測和有條件預(yù)測所謂無條件預(yù)測，是指預(yù)測模型中所有的解釋變量的值都是已知的，在此條件下所進(jìn)行的預(yù)測。所謂有條件預(yù)測，是指預(yù)測模型中某些解釋變量的值是未知的，因此想要對被解釋變量進(jìn)行預(yù)測，必須首先預(yù)測解釋變量的值。,75,（2）樣本內(nèi)（in-sample）預(yù)測和樣本外（out-of-sample）預(yù)測所謂樣本內(nèi)預(yù)測是指用全部觀測值來估計(jì)

30、模型，然后用估計(jì)得到的模型對其中的一部分觀測值進(jìn)行預(yù)測。樣本外預(yù)測是指將全部觀測值分為兩部分，一部分用來估計(jì)模型，然后用估計(jì)得到的模型對另一部分?jǐn)?shù)據(jù)進(jìn)行預(yù)測。,76,（3）事前預(yù)測和事后模擬顧名思義，事后模擬就是我們已經(jīng)獲得要預(yù)測的值的實(shí)際值，進(jìn)行預(yù)測是為了評價(jià)預(yù)測模型的好壞。事前預(yù)測是我們在不知道因變量真實(shí)值的情況下對其的預(yù)測。,77,（4）一步向前（one-step-ahead）預(yù)測和多步向前（multi-step-ahead）預(yù)測所謂一步向前預(yù)測，是指僅對下一期的變量值進(jìn)行預(yù)測，例如在t期對t+1期的值進(jìn)行預(yù)測，在t+1期對t+2期的值進(jìn)行的預(yù)測等。多步向前預(yù)測則不僅是對下一期

31、的值進(jìn)行預(yù)測，也對更下期值進(jìn)行預(yù)測，例如在t期對t+1期、t+2期、t+r期的值進(jìn)行預(yù)測。,78,二、預(yù)測的評價(jià)標(biāo)準(zhǔn) 、平均預(yù)測誤差平方和（mean squared error，簡記MSE）平均預(yù)測誤差絕對值（mean absolute error,簡記MAE）。變量的MSE定義為： MSE= （2.66）其中的預(yù)測值，實(shí)際值，T時(shí)段數(shù),,79,變量的MAE定義如下： MAE= ，變量的定義同前（2.67）可以看到，MSE和MAE度量的是誤差的絕對大小，只能通過與該變量平均值的比較來判斷誤差的大小，誤差越大，說明模型的預(yù)測效果越不理想。,

32、,80,2、Theil不相等系數(shù) 其定義為：（2.68）注意，U的分子就是MSE的平方根，而分母使得U總在0與1之間。如果U=0，則對所有的t，完全擬合；如果U=1，則模型的預(yù)測能力最差。因此，Theil不等系數(shù)度量的是誤差的相對大小。,,,81,Theil不等系數(shù)可以分解成如下有用的形式：其中分別是序列和的平均值和標(biāo)準(zhǔn)差，是它們的相關(guān)系數(shù)，即：,,（2.69）,,,,,,82,定義不相等比例如下：,,（2.70）,,,（2.71）,（2.72）,83,偏誤比例表示系統(tǒng)誤差，因?yàn)樗攘康氖悄M序列與實(shí)際序列之間的偏離程度。方差比例

33、表示的是模型中的變量重復(fù)其實(shí)際變化程度的能力。協(xié)方差比例度量的是非系統(tǒng)誤差，即反映的是考慮了與平均值的離差之后剩下的誤差。理想的不相等比例的分布是。,,,,,比例分別稱為U的偏誤比例，方差比例，協(xié)方差比例。它們是將模型誤差按特征來源分解的有效方法（）。,84,第五節(jié)：模型選擇,一、“好”模型具有的特性 1、節(jié)省性（parsimony）一個(gè)好的模型應(yīng)在相對精確反應(yīng)現(xiàn)實(shí)的基礎(chǔ)上盡可能的簡單。 2、可識別性（identifiability）對于給定的一組數(shù)據(jù)，估計(jì)的參數(shù)要有唯一確定值。,85,3、高擬合性（goodness of fit）回歸

34、分析的基本思想是用模型中包含的變量來解釋被解釋變量的變化，因此解釋能力的高低就成為衡量模型好壞的重要的標(biāo)準(zhǔn)。 4、理論一致性（theoretical consistency）即使模型的擬合性很高，但是如果模型中某一變量系數(shù)的估計(jì)值符號與經(jīng)濟(jì)理論不符，那么這個(gè)模型就是失敗的。,86,5、預(yù)測能力（predictive power）著名經(jīng)濟(jì)學(xué)家弗里德曼（M.Friedman）認(rèn)為：“對假設(shè)（模型）的真實(shí)性唯一有效的檢驗(yàn)就是將預(yù)測值與經(jīng)驗(yàn)值相比較”。因此一個(gè)好的模型必須有對未來的較強(qiáng)的預(yù)測能力。,87,二、用于預(yù)測的模型的選擇因?yàn)镽2將隨著模型解釋變量的增多而不斷增加，按照此標(biāo)準(zhǔn)我們將不會得到

35、最佳的預(yù)測模型。因此必須對由于解釋變量增多而造成自由度丟失施加一個(gè)懲罰項(xiàng)，其中的一個(gè)標(biāo)準(zhǔn)就是：,,88,對自由度丟失懲罰更為嚴(yán)格的標(biāo)準(zhǔn)： Akaike的信息準(zhǔn)則（Akaike information criterion,簡記為AIC）和Schwarz的信息準(zhǔn)則（Schwarz information criterion,簡記為SC）,,,89,其中是方程隨機(jī)誤差項(xiàng)方差的估計(jì)值，k是解釋變量的個(gè)數(shù)，T是樣本容量。可以看到，AIC和SC 的懲罰項(xiàng) 、比更為嚴(yán)厲，而且相對來說SC標(biāo)準(zhǔn)對自由度的懲罰比AIC更為嚴(yán)厲。無論是AIC標(biāo)準(zhǔn)還是SC標(biāo)準(zhǔn)，從預(yù)測的角度來看，度量值越低，模型的預(yù)測會更好。,,,,,90,本章小節(jié),本章內(nèi)容在計(jì)量經(jīng)濟(jì)學(xué)中是最基礎(chǔ)也是最重要的部分。在這一章中，我們首先介紹了最小二乘法及其估計(jì)量的性質(zhì)和分布。在此基礎(chǔ)上我們對一元線性回歸模型的統(tǒng)計(jì)檢驗(yàn)進(jìn)行了詳細(xì)討論，接著將模型擴(kuò)展，討論了多元線性回歸模型。在用模型進(jìn)行預(yù)測時(shí)，主要有兩種情況：即有條件預(yù)測和無條件預(yù)測。最后一小節(jié)我們簡單介紹了模型的選擇。,

展開閱讀全文

溫馨提示:
1: 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

點(diǎn)擊下載此資源

最小二乘法OLS和線性回歸.ppt

最新文檔

相關(guān)資源

相關(guān)搜索