《高考數(shù)學(xué)總復(fù)習(xí) 第10章 第3節(jié) 變量間的相關(guān)關(guān)系、統(tǒng)計(jì)案例課件 新人教A版》由會(huì)員分享,可在線閱讀,更多相關(guān)《高考數(shù)學(xué)總復(fù)習(xí) 第10章 第3節(jié) 變量間的相關(guān)關(guān)系、統(tǒng)計(jì)案例課件 新人教A版(52頁珍藏版)》請?jiān)谘b配圖網(wǎng)上搜索。
1、第三節(jié)變量間的相關(guān)關(guān)系、統(tǒng)計(jì)案例 1會(huì)作兩個(gè)有關(guān)聯(lián)變量數(shù)據(jù)的散點(diǎn)圖,會(huì)利用散點(diǎn)圖認(rèn)識(shí)變量間的相關(guān)關(guān)系2了解最小二乘法的思想,能根據(jù)給出的線性回歸方程系數(shù)公式建立線性回歸方程3了解下列常見的統(tǒng)計(jì)方法,并能應(yīng)用這些方法解決一些實(shí)際問題(1)了解獨(dú)立性檢驗(yàn)(只要求22列聯(lián)表)的基本思想、方法及其簡單應(yīng)用(2)了解回歸的基本思想、方法及其簡單應(yīng)用一、兩個(gè)變量的線性相關(guān)1正相關(guān)在散點(diǎn)圖中,點(diǎn)散布在從 到 的區(qū)域,對于兩個(gè)變量的這種相關(guān)關(guān)系,我們將它稱為正相關(guān)左下角右上角2負(fù)相關(guān)在散點(diǎn)圖中,點(diǎn)散布在從 到 的區(qū)域,兩個(gè)變量的這種相關(guān)關(guān)系稱為負(fù)相關(guān)3線性相關(guān)關(guān)系、回歸直線如果散點(diǎn)圖中點(diǎn)的分布從整體上看大致在
2、 ,就稱這兩個(gè)變量之間具有線性相關(guān)關(guān)系,這條直線叫做回歸直線左上角右下角附近一條直線相關(guān)關(guān)系與函數(shù)關(guān)系有何異同點(diǎn)?提示:相同點(diǎn):兩者均是指兩個(gè)變量的關(guān)系不同點(diǎn):函數(shù)關(guān)系是一種確定的關(guān)系,相關(guān)關(guān)系是一種非確定的關(guān)系二、回歸方程1最小二乘法求回歸直線使得樣本數(shù)據(jù)的點(diǎn)到回歸直線的 的方法叫做最小二乘法平方和最小距離的三、回歸分析1定義:對具有的兩個(gè)變量進(jìn)行統(tǒng)計(jì)分析的一種常用方法2隨機(jī)誤差:線性回歸模型用ybxae表示,其中a和b為模型的 ,稱為隨機(jī)誤差3樣本點(diǎn)的中心在具有線性相關(guān)關(guān)系的數(shù)據(jù)(x1,y1),(x2,y2),(xn,yn)中,回歸方程的截距和斜率的最小二乘估計(jì)公式分別為:相關(guān)關(guān)系未知參數(shù)
3、e4相關(guān)系數(shù)r;當(dāng)r0時(shí),表明兩個(gè)變量;當(dāng)r0時(shí),表明兩個(gè)變量r的絕對值越接近于1,表明兩個(gè)變量的線性相關(guān)性 ,r的絕對值越接近于0時(shí),表明兩個(gè)變量之間 ,通常|r|大于時(shí),認(rèn)為兩個(gè)變量有很強(qiáng)的線性相關(guān)性正相關(guān)負(fù)相關(guān)越強(qiáng)相關(guān)性越弱0.75四、殘差分析1總偏差平方和把每個(gè)效應(yīng)(觀測值減去總的平均值)的平方加起來即: .2殘差數(shù)據(jù)點(diǎn)和它在回歸直線上相應(yīng)位置的差異 是的效應(yīng),稱 為相應(yīng)于點(diǎn)(xi,yi)的殘差3殘差平方和 .隨機(jī)誤差4相關(guān)指數(shù)R2.R2的值越大,說明殘差平方和,也就是說模型的擬合效果 在線性回歸模型中,R2表示解釋變量對預(yù)報(bào)變量變化的貢獻(xiàn)率,R2越接近于1,表示回歸的效果 越小越好越
4、好五、獨(dú)立性檢驗(yàn)1分類變量:變量的不同“值”表示個(gè)體所屬的 ,像這樣的變量稱為分類變量2列聯(lián)表:列出兩個(gè)分類變量的,稱為列聯(lián)表假設(shè)有兩個(gè)分類變量X和Y,它們的可能取值分別為x1,x2和y1,y2,其樣本頻數(shù)列聯(lián)表(稱為22列聯(lián)表)為22列聯(lián)表不同類別頻數(shù)表y1y2總計(jì)x1ababx2cdcd總計(jì)acbdabcd構(gòu)造一個(gè)隨機(jī)變量K2,其中n 為樣本容量3獨(dú)立性檢驗(yàn)利用隨機(jī)變量、 來確定是否一定有把握認(rèn)為“兩個(gè)分類變量有關(guān)系”的方法稱為兩個(gè)分類變量的獨(dú)立性檢驗(yàn)abcd獨(dú)立性假設(shè)1下列兩個(gè)變量之間的關(guān)系哪個(gè)是相關(guān)關(guān)系()A角度和它的余弦值B正方形的邊長和它的面積C正n邊形的邊數(shù)和頂點(diǎn)角度之和D人的年
5、齡和身高解析:A、B、C中的兩個(gè)變量都是函數(shù)關(guān)系,它們可以用函數(shù)關(guān)系式來表示,D中的兩個(gè)變量之間的關(guān)系是相關(guān)關(guān)系答案:DA變量x與y正相關(guān),u與v正相關(guān)B變量x與y正相關(guān),u與v負(fù)相關(guān)C變量x與y負(fù)相關(guān),u與v正相關(guān)D變量x與y負(fù)相關(guān),u與v負(fù)相關(guān)解析:由正、負(fù)相關(guān)的定義知,x與y負(fù)相關(guān),u與v正相關(guān)答案:C3(2011江西高考)為了解兒子身高與其父親身高的關(guān)系,隨機(jī)抽取5對父子的身高數(shù)據(jù)如下:父親身高x(cm)174176176176178兒子身高y(cm)175175176177177答案:C答案:0.2545為了了解患慢性氣管炎與吸煙的關(guān)系,調(diào)查了228人,其中每天的吸煙支數(shù)在10支以上
6、20支以下的調(diào)查中,患者人數(shù)有98人,非患者人數(shù)有89人;每天的吸煙支數(shù)在20支以上的調(diào)查者中,患者人數(shù)有25人,非患者人數(shù)有16人,試問患慢性氣管炎與吸煙量_(填“是”或“否”)相互獨(dú)立解析:由已知條件得出下表:10支19支20支以上合計(jì)患者人數(shù)9825123非患者人數(shù)8916105合計(jì)18741228答案:是 在散點(diǎn)圖中,如果所有的樣本點(diǎn)都落在某一函數(shù)的曲線上,就用該函數(shù)來描述變量之間的關(guān)系,即變量之間具有函數(shù)關(guān)系如果所有的樣本點(diǎn)都落在某一函數(shù)的曲線附近,變量之間就有相關(guān)關(guān)系如果所有的樣本點(diǎn)都落在某一直線附近,變量之間就有線性相關(guān)關(guān)系 在某地區(qū)的1230歲居民中隨機(jī)抽取了10個(gè)人的身高和體
7、重的統(tǒng)計(jì)資料如下表:根據(jù)上述數(shù)據(jù),畫出散點(diǎn)圖并判斷居民的身高和體重之間是否有相關(guān)關(guān)系身高(cm)143 156 159 172 165 171 177 161 164 160體重(kg)41496179686974696854【特別提醒】函數(shù)關(guān)系是一種理想的關(guān)系模型,而相關(guān)關(guān)系是一種更為一般的情況利用當(dāng)r0時(shí),兩個(gè)變量正相關(guān),當(dāng)r0時(shí),兩個(gè)變量負(fù)相關(guān);r的絕對值越接近于1,表明兩個(gè)變量的線性相關(guān)性越強(qiáng);r的絕對值越接近于0,表明兩個(gè)變量之間幾乎不存在線性相關(guān)關(guān)系通常當(dāng)|r|大于0.75時(shí),認(rèn)為兩個(gè)變量有很強(qiáng)的線性相關(guān)關(guān)系,因而求回歸直線方程才有意義如果k7.879,就有99.5%的把握認(rèn)為“X
8、與Y有關(guān)系”;如果k6.635,就有99%的把握認(rèn)為“X與Y有關(guān)系”;如果k5.024,就有97.5%的把握認(rèn)為“X與Y有關(guān)系”;如果k3.841,就有95%的把握認(rèn)為“X與Y有關(guān)系”;如果k2.706,就有90%的把握認(rèn)為“X與Y有關(guān)系”;如果k2.706,就認(rèn)為沒有充分的證據(jù)顯示“X與Y有關(guān)系”在調(diào)查的480名男人中有38名患有色盲,520名女人中有6名患有色盲,利用獨(dú)立性檢驗(yàn)的方法來判斷色盲與性別是否有關(guān)?你所得到的結(jié)論在什么范圍內(nèi)有效?題眼:線性回歸問題 (12分)某電腦公司有6名產(chǎn)品推銷員,其工作年限與年推銷金額的數(shù)據(jù)如下表:推銷員編號(hào)12345工作年限x/年35679推銷金額y/萬
9、元23345(1)以工作年限為自變量x,推銷金額為因變量y,作出散點(diǎn)圖;(2)求年銷售金額y關(guān)于工作年限x的回歸直線方程;(3)若第6名推銷員的工作年限為11年,試估計(jì)他的年推銷金額【審題】(1)先用散點(diǎn)圖判斷x、y的線性相關(guān)關(guān)系;(2)求回歸直線方程;(3)作出估計(jì)(3)由(2)可知,當(dāng)x11時(shí),0.5x0.40.5110.45.9(萬元)可以估計(jì)第6名推銷員的年推銷金額為5.9萬元.12分【答題樣板】第一步:判斷兩個(gè)變量的線性相關(guān)性;第二步:求回歸直線的斜率和截距;第三步:確定回歸直線方程;第四步:根據(jù)回歸直線方程對隨機(jī)變量作出預(yù)測;第五步:反思回顧,查看關(guān)鍵點(diǎn),易錯(cuò)點(diǎn)和答題規(guī)范【心得】(1)本題易錯(cuò)點(diǎn)有兩個(gè),一是忽略對變量間的相關(guān)性進(jìn)行檢驗(yàn);二是計(jì)算易出錯(cuò)(2)如果不先作線性相關(guān)性檢驗(yàn),我們雖然也可以求出x與y的回歸直線方程,但這時(shí)的回歸直線方程也許沒有任何實(shí)際價(jià)值,它也就不能確定地反映變量x與y之間的變化規(guī)律,只有在x與y之間具有相關(guān)關(guān)系時(shí),求得的回歸直線方程才具有實(shí)際意義