《高考數(shù)學(xué) 一輪復(fù)習(xí)學(xué)案訓(xùn)練課件北師大版理科: 第9章 算法初步、統(tǒng)計與統(tǒng)計案例 第4節(jié) 變量間的相關(guān)關(guān)系與統(tǒng)計案例學(xué)案 理 北師大版》由會員分享,可在線閱讀,更多相關(guān)《高考數(shù)學(xué) 一輪復(fù)習(xí)學(xué)案訓(xùn)練課件北師大版理科: 第9章 算法初步、統(tǒng)計與統(tǒng)計案例 第4節(jié) 變量間的相關(guān)關(guān)系與統(tǒng)計案例學(xué)案 理 北師大版(9頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、
第四節(jié) 變量間的相關(guān)關(guān)系與統(tǒng)計案例
[考綱傳真] (教師用書獨具)1.會做兩個有關(guān)聯(lián)變量的數(shù)據(jù)的散點圖,并利用散點圖認(rèn)識變量間的相關(guān)關(guān)系.2.了解最小二乘法的思想,能根據(jù)給出的線性回歸方程系數(shù)公式建立線性回歸方程(線性回歸系數(shù)公式不要求記憶).3.了解回歸分析的基本思想、方法及其簡單應(yīng)用.4.了解獨立性檢驗(只要求2×2列聯(lián)表)的思想、方法及其初步應(yīng)用.
(對應(yīng)學(xué)生用書第165頁)
[基礎(chǔ)知識填充]
1.兩個變量的線性相關(guān)
(1)正相關(guān)
在散點圖中,點散布在從左下角到右上角的區(qū)域,對于兩個變量的這種相關(guān)關(guān)系,我們將它稱為正相關(guān).
(2)負(fù)相關(guān)
在散點圖中
2、,點散布在從左上角到右下角的區(qū)域,兩個變量的這種相關(guān)關(guān)系稱為負(fù)相關(guān).
(3)線性相關(guān)關(guān)系、回歸直線
如果散點圖中點的分布從整體上看大致在一條直線附近,就稱這兩個變量之間具有線性相關(guān)關(guān)系,這條直線叫作回歸直線.
2.回歸方程
(1)最小二乘法
求回歸直線,使得樣本數(shù)據(jù)的點到它的距離的平方和最小的方法叫作最小二乘法.
(2)回歸方程
方程y=bx+a是兩個具有線性相關(guān)關(guān)系的變量的一組數(shù)據(jù)(x1,y1),(x2,y2),…,(xn,yn)的回歸方程,其中a,b是待定參數(shù).
3.回歸分析
(1)定義:對具有相關(guān)關(guān)系的兩個變量進(jìn)行統(tǒng)計分析的一種常用方法.
(2)樣本點的中心
對
3、于一組具有線性相關(guān)關(guān)系的數(shù)據(jù)(x1,y1),(x2,y2),…,(xn,yn),其中(,)稱為樣本點的中心.
(3)相關(guān)系數(shù)
當(dāng)r>0時,表明兩個變量正相關(guān);
當(dāng)r<0時,表明兩個變量負(fù)相關(guān).
r的絕對值越接近于1,表明兩個變量的線性相關(guān)性越強(qiáng).r的絕對值越接近于0,表明兩個變量之間幾乎不存在線性相關(guān)關(guān)系.通常|r|大于0.75時,認(rèn)為兩個變量有很強(qiáng)的線性相關(guān)性.
4.獨立性檢驗
(1)分類變量:變量的不同“值”表示個體所屬的不同類別,像這類變量稱為分類變量.
(2)列聯(lián)表:列出兩個分類變量的頻數(shù)表,稱為列聯(lián)表.假設(shè)有兩個分類變量X和Y,它們的可能取值分別為{x1,x2}和{y1
4、,y2},其樣本頻數(shù)列聯(lián)表(稱為2×2列聯(lián)表)為
2×2列聯(lián)表
y1
y2
總計
x1
a
b
a+b
x2
c
d
c+d
總計
a+c
b+d
a+b+c+d
構(gòu)造一個隨機(jī)變量χ2=,其中n=a+b+c+d為樣本容量.
(3)獨立性檢驗
利用隨機(jī)變量χ2來判斷“兩個分類變量有關(guān)系”的方法稱為獨立性檢驗.
[知識拓展] 1.b的幾何意義:體現(xiàn)平均增加或平均減少.
2.由回歸直線求出的數(shù)據(jù)是估算值,不是精確值.
[基本能力自測]
1.(思考辨析)判斷下列結(jié)論的正誤.(正確的打“√”,錯誤的打“×”)
(1)“名師
5、出高徒”可以解釋為教師的教學(xué)水平與學(xué)生的水平成正相關(guān)關(guān)系.( )
(2)通過回歸直線方程y=bx+a可以估計預(yù)報變量的取值和變化趨勢.( )
(3)因為由任何一組觀測值都可以求得一個線性回歸方程,所以沒有必要進(jìn)行相關(guān)性檢驗.( )
(4)事件X,Y關(guān)系越密切,則由觀測數(shù)據(jù)計算得到的χ2的觀測值越大.( )
[答案] (1)√ (2)√ (3)× (4)√
2.(教材改編)已知變量x與y正相關(guān),且由觀測數(shù)據(jù)算得樣本平均數(shù)=3,=3.5,則由該觀測數(shù)據(jù)算得的線性回歸方程可能是( )
A.y=0.4x+2.3 B.y=2x-2.4
C.y=-2x+9.5 D.y
6、=-0.3x+4.4
A [因為變量x和y正相關(guān),排除選項C,D.又樣本中心(3,3.5)在回歸直線上,排除B,選項A滿足.]
3.下面是一個2×2列聯(lián)表
y1
y2
總計
x1
a
21
73
x2
2
25
27
總計
b
46
則表中a,b處的值分別為________.
52,54 [因為a+21=73,所以a=52.又因為a+2=b,所以b=54.]
4.調(diào)查了某地若干戶家庭的年收入x(單位:萬元)和年飲食支出y(單位:萬元),調(diào)查顯示年收入x與年飲食支出y具有線性相關(guān)關(guān)系,并由調(diào)查數(shù)據(jù)得到回歸直線方程:y=0.254x+0.32
7、1,由回歸直線方程可知,家庭年收入每增加1萬元,年飲食支出平均約增加________萬元.
0.254 [由題意知回歸直線的斜率為0.254,
故家庭年收入每增加1萬元,年飲食支出平均約增加0.254萬元.]
5.為了判斷高中三年級學(xué)生是否選修文科與性別的關(guān)系,現(xiàn)隨機(jī)抽取50名學(xué)生,得到如下2×2列聯(lián)表:
理科
文科
男
13
10
女
7
20
已知P(χ2≥3.841)≈0.05,P(χ2≥5.024)≈0.025.
根據(jù)表中數(shù)據(jù),得到χ2的觀測值k=≈4.844.則認(rèn)為選修文科與性別有關(guān)系出錯的可能性為________.
5% [χ2的觀測值k≈
8、4.844,這表明小概率事件發(fā)生.根據(jù)假設(shè)檢驗的基本原理,應(yīng)該斷定“是否選修文科與性別之間有關(guān)系”成立,并且這種判斷出錯的可能性約為5%.]
(對應(yīng)學(xué)生用書第166頁)
相關(guān)關(guān)系的判斷
(1)已知變量x和y滿足關(guān)系y=-0.1x+1,變量y與z正相關(guān).下列結(jié)論中正確的是( )
A.x與y正相關(guān),x與z負(fù)相關(guān)
B.x與y正相關(guān),x與z正相關(guān)
C.x與y負(fù)相關(guān),x與z負(fù)相關(guān)
D.x與y負(fù)相關(guān),x與z正相關(guān)
(2)x和y的散點圖如圖941所示,則下列說法中所有正確命題的序號為________.
【導(dǎo)學(xué)號:79140333】
圖9&
9、#173;41
①x,y是負(fù)相關(guān)關(guān)系;
②在該相關(guān)關(guān)系中,若用y=c1ec2x擬合時的相關(guān)指數(shù)為R,用y=bx+a擬合時的相關(guān)指數(shù)為R,則R>R;
③x,y之間不能建立線性回歸方程.
(1)C (2)①② [(1)因為y=-0.1x+1的斜率小于0,故x與y負(fù)相關(guān).因為y與z正相關(guān),可設(shè)z=by+a,b>0,則z=by+a=-0.1bx+b+a,故x與z負(fù)相關(guān).
(2)在散點圖中,點散布在從左上角到右下角的區(qū)域,因此x,y是負(fù)相關(guān)關(guān)系,故①正確;由散點圖知用y=c1ec2x擬合比用y=bx+a擬合效果要好,則R>R,故②正確;x,y之間可以建立線性回歸方程,但擬合效
10、果不好,故③錯誤.]
[規(guī)律方法] 判定兩個變量正、負(fù)相關(guān)性的方法
(1)畫散點圖:點的分布從左下角到右上角,兩個變量正相關(guān);點的分布從左上角到右下角,兩個變量負(fù)相關(guān).
(2)相關(guān)系數(shù):r>0時,正相關(guān);r<0時,負(fù)相關(guān).
(3)線性回歸直線方程中:b>0時,正相關(guān);b<0時,負(fù)相關(guān).
[跟蹤訓(xùn)練] 某公司在上半年的月收入x(單位:萬元)與月支出y(單位:萬元)的統(tǒng)計資料如表所示:
月份
1月份
2月份
3月份
4月份
5月份
6月份
收入x
12.3
14.5
15.0
17.0
19.8
20.6
支出y
5.63
5.75
5.8
11、2
5.89
6.11
6.18
根據(jù)統(tǒng)計資料,則( )
A.月收入的中位數(shù)是15,x與y有正線性相關(guān)關(guān)系
B.月收入的中位數(shù)是17,x與y有負(fù)線性相關(guān)關(guān)系
C.月收入的中位數(shù)是16,x與y有正線性相關(guān)關(guān)系
D.月收入的中位數(shù)是16,x與y有負(fù)線性相關(guān)關(guān)系
C [月收入的中位數(shù)是=16,收入增加,支出增加,故x與y有正線性相關(guān)關(guān)系.]
回歸分析
(20xx·全國卷Ⅰ)為了監(jiān)控某種零件的一條生產(chǎn)線的生產(chǎn)過程,檢驗員每隔30 min從該生產(chǎn)線上隨機(jī)抽取一個零件,并測量其尺寸(單位:cm).下面是檢驗員在一天內(nèi)依次抽取的16個零件的尺寸:
抽取次
12、序
1
2
3
4
5
6
7
8
零件尺寸
9.95
10.12
9.96
9.96
10.01
9.92
9.98
10.04
抽取次序
9
10
11
12
13
14
15
16
零件尺寸
10.26
9.91
10.13
10.02
9.22
10.04
10.05
9.95
經(jīng)計算得=xi=9.97,s==≈0.212,≈18.439,(xi-)(i-8.5)=-2.78,其中xi為抽取的第i個零件的尺寸,i=1,2,…,16.
(1)求(xi,i)(i=1,2,…,16)
13、的相關(guān)系數(shù)r,并回答是否可以認(rèn)為這一天生產(chǎn)的零件尺寸不隨生產(chǎn)過程的進(jìn)行而系統(tǒng)地變大或變小(若|r|<0.25,則可以認(rèn)為零件的尺寸不隨生產(chǎn)過程的進(jìn)行而系統(tǒng)地變大或變小);
(2)一天內(nèi)抽檢零件中,如果出現(xiàn)了尺寸在(-3s,+3s)之外的零件,就認(rèn)為這條生產(chǎn)線在這一天的生產(chǎn)過程可能出現(xiàn)了異常情況,需對當(dāng)天的生產(chǎn)過程進(jìn)行檢查.
(ⅰ)從這一天抽檢的結(jié)果看,是否需對當(dāng)天的生產(chǎn)過程進(jìn)行檢查?
(ⅱ)在(-3s,+3s)之外的數(shù)據(jù)稱為離群值,試剔除離群值,估計這條生產(chǎn)線當(dāng)天生產(chǎn)的零件尺寸的均值與標(biāo)準(zhǔn)差.(精確到0.01)
附:樣本(xi,yi)(i=1,2,…,n)的相關(guān)系數(shù)r=,≈0.0
14、9.
[解] (1)由樣本數(shù)據(jù)得(xi,i)(i=1,2,…,16)的相關(guān)系數(shù)
r=
≈≈-0.18.
由于|r|<0.25,因此可以認(rèn)為這一天生產(chǎn)的零件尺寸不隨生產(chǎn)過程的進(jìn)行而系統(tǒng)地變大或變?。?
(2)(ⅰ)由于=9.97,s≈0.212,因此由樣本數(shù)據(jù)可以看出抽取的第13個零件的尺寸在(-3s,+3s)以外,因此需對當(dāng)天的生產(chǎn)過程進(jìn)行檢查.
(ⅱ)剔除離群值,即第13個數(shù)據(jù),剩下數(shù)據(jù)的平均數(shù)為
(16×9.97-9.22)=10.02,
這條生產(chǎn)線當(dāng)天生產(chǎn)的零件尺寸的均值的估計值為10.02.
x≈16×0.2122+16×9.972≈
15、1 591.134,
剔除第13個數(shù)據(jù),剩下數(shù)據(jù)的樣本方差為
(1 591.134-9.222-15×10.022)≈0.008,
這條生產(chǎn)線當(dāng)天生產(chǎn)的零件尺寸的標(biāo)準(zhǔn)差的估計值為≈0.09.
[規(guī)律方法] 1.回歸直線方程中系數(shù)的兩種求法
(1)利用公式,求出回歸系數(shù)b,a.
(2)待定系數(shù)法:利用回歸直線過樣本點中心求系數(shù).
2.回歸分析的兩種策略
(1)利用回歸方程進(jìn)行預(yù)測:把回歸直線方程看作一次函數(shù),求函數(shù)值.
(2)利用回歸直線判斷正、負(fù)相關(guān):決定正相關(guān)還是負(fù)相關(guān)的是回歸系數(shù)B.
3.選擇填空中選一組數(shù)據(jù)的線性回歸直線方程的方法
(1)過定點(),驗證.
16、
(2)正、負(fù)相關(guān)看b的符號.
(3)代入數(shù)據(jù)看誤差大小.
[跟蹤訓(xùn)練] 為了解某地區(qū)某種農(nóng)產(chǎn)品的年產(chǎn)量x(單位:噸)對價格y(單位:千元/噸)和年利潤z的影響,對近五年該農(nóng)產(chǎn)品的年產(chǎn)量和價格統(tǒng)計如下表:
x
1
2
3
4
5
y
7.0
6.5
5.5
3.8
2.2
(1)求y關(guān)于x的線性回歸方程y=bx+a;
(2)若每噸該農(nóng)產(chǎn)品的成本為2千元,假設(shè)該農(nóng)產(chǎn)品可全部賣出,預(yù)測當(dāng)年產(chǎn)量為多少時,年利潤z取到最大值?(保留兩位小數(shù))
參考公式:b==,a=-b.
[解] (1)由題知=3,=5,xiyi=62.7,x=55,
b===-1.23,
a
17、=-b=5-(-1.23)×3=8.69,
所以y關(guān)于x的線性回歸方程為y=-1.23x+8.69.
(2)年利潤z=x(-1.23x+8.69)-2x=-1.23x2+6.69=-1.232+1.23×,
即當(dāng)x=≈2.72時,年利潤z最大.
獨立性檢驗
(20xx·皖北名校聯(lián)考)某醫(yī)院對治療支氣管肺炎的兩種方案A,B進(jìn)行比較研究,將志愿者分為兩組,分別采用方案A和方案B進(jìn)行治療,統(tǒng)計結(jié)果如下:
有效
無效
總計
使用方案A組
96
120
使用方案B組
72
總計
32
(1)完成上述列聯(lián)表
18、,并比較兩種治療方案有效的頻率;
(2)能否在犯錯誤的概率不超過0.05的前提下認(rèn)為治療是否有效與方案選擇有關(guān)?
附:χ2=,其中n=a+b+c+D.
P(χ2≥k0)
0.05
0.010
0.001
k0
3.841
6.635
10.828
[解] (1)列聯(lián)表如下:
有效
無效
總計
使用方案A組
96
24
120
使用方案B組
72
8
80
總計
168
32
200
使用方案A組有效的頻率為=0.8;
使用方案B組有效的頻率為=0.9.
(2)χ2=≈3.517<3.841,
所以不能在犯錯誤的概率不超過0.05的
19、前提下認(rèn)為治療是否有郊與方案選擇有關(guān).
[規(guī)律方法] 解決獨立性檢驗問題的一般步驟
(1)根據(jù)樣本數(shù)據(jù)制成2×2列聯(lián)表.
(2)根據(jù)公式χ2=,計算χ2的值.
(3)查表比較χ2與臨界值的大小關(guān)系,作統(tǒng)計判斷.
易錯警示:應(yīng)用獨立性檢驗方法解決問題,易出現(xiàn)不能準(zhǔn)確計算χ2值的錯誤.
[跟蹤訓(xùn)練] (20xx·江西九校聯(lián)考)隨著國家二孩政策的全面放開,為了調(diào)查一線城市和非一線城市的二孩生育意愿,某機(jī)構(gòu)用簡單隨機(jī)抽樣方法從不同地區(qū)調(diào)查了100位育齡婦女,結(jié)果如圖.
非一線
一線
總計
愿生
45
20
65
不愿生
13
22
35
總計
58
42
100
算得χ2=≈9.616.
附表:
P(χ2≥k0)
0.050
0.010
0.001
k0
3.841
6.635
10.828
參照附表,得到的正確結(jié)論是( )
A.在犯錯誤的概率不超過0.1%的前提下,認(rèn)為“生育意愿與城市級別有關(guān)”
B.在犯錯誤的概率不超過0.1%的前提下,認(rèn)為“生育意愿與城市級別無關(guān)”
C.有99%以上的把握認(rèn)為“生育意愿與城市級別有關(guān)”
D.有99%以上的把握認(rèn)為“生育意愿與城市級別無關(guān)”
C [因為χ2≈9.616>6.635,所以有99%以上的把握認(rèn)為“生育意愿與城市級別有關(guān)”,故選C.]