3、變量X與Y正相關,變量U與V負相關,所以r1>0,r2<0.故選C.
[答案] C
4.兩個變量y與x的回歸模型中,分別選擇了4個不同模型,對于樣本點(x1,y1),(x2,y2),…,(xn,yn),可以用R2=1-來刻畫回歸的效果.已知模型1中R2=0.95,模型2中R2=0.81,模型3中R2=0.65,模型4中R2=0.52,其中擬合效果最好的模型是( )
A.模型1 B.模型2 C.模型3 D.模型4
[解析] R2值越大,模型的擬合效果越好,故選A.
[答案] A
5.通過隨機詢問110名性別不同的大學生是否愛好某項運動,得到如下的列聯(lián)表:
男
女
總
4、計
愛好
40
20
60
不愛好
20
30
50
總計
60
50
110
由K2=算得,
K2=≈7.8.附表:
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
參照附表,得到的正確結論是( )
A.在犯錯誤的概率不超過0.1%的前提下,認為“愛好該項運動與性別有關”
B.在犯錯誤的概率不超過0.1%的前提下,認為“愛好該項運動與性別無關”
C.有99%以上的把握認為“愛好該項運動與性別有關”
D.有99%以上的把握認為“愛好該項運動與性別無關”
[解析] 根據(jù)獨立性檢驗的思想方法,正
5、確選項為C.
[答案] C
6.(20xx·西寧檢測)下列說法:
①將一組數(shù)據(jù)中的每一個數(shù)據(jù)都加上或減去同一個常數(shù)后,方差不變;②設有一個線性回歸方程=3-5x,變量x增加1個單位時,y平均增加5個單位;③設具有相關關系的兩個變量x,y的相關系數(shù)為r,則|r|越接近于0,x和y之間的線性相關程度越強;④在一個2×2列聯(lián)表中,由計算得K2的值,則K2的值越大,判斷兩個變量間有關聯(lián)的把握就越大.
其中錯誤的個數(shù)是( )
A.0 B.1 C.2 D.3
[解析] 方差反映一組數(shù)據(jù)的波動大小,將一組數(shù)據(jù)中的每個數(shù)據(jù)都加上或減去同一個常數(shù)后,方差不變,故①正確;在回歸方程=3-5x中
6、,變量x增加1個單位時,y平均減小5個單位,故②不正確;根據(jù)線性回歸分析中相關系數(shù)的定義:在線性回歸分析中,相關系數(shù)為r,|r|越接近于1,相關程度越強,故③不正確;對分類變量x與y的隨機變量的觀測值K2來說,K2越大,“x與y有關系”的可信程度越大,故④正確.綜上所述,錯誤結論的個數(shù)為2,故選C.
[答案] C
二、填空題
7.已知由一組樣本數(shù)據(jù)確定的回歸直線方程為=1.5x+1,且=2,發(fā)現(xiàn)有兩組數(shù)據(jù)(2.2,2.9)與(1.8,5.1)誤差較大,去掉這兩組數(shù)據(jù)后,重新求得回歸直線的斜率為1,那么當x=4時,y的估計值為__________.
[解析] 已知=2,則=1.5×2+1
7、=4,由題意知去掉兩組數(shù)據(jù)后中心沒變,設重新求得的回歸直線方程為=x+b,將樣本點的中心(2, 4)代入得b=2,因而當x=4時,y的估計值為6.
[答案] 6
8.柴靜《穹頂之下》的播出,讓大家對霧霾天氣的危害有了更進一步的認識,對于霧霾天氣的研究也漸漸活躍起來,某研究機構對春節(jié)燃放煙花爆竹的天數(shù)x與霧霾天數(shù)y進行統(tǒng)計分析,得出下表數(shù)據(jù):
x
4
5
7
8
y
2
3
5
6
(1)請畫出上表數(shù)據(jù)的散點圖;
(2)請根據(jù)上表提供的數(shù)據(jù),用最小二乘法求出y關于x的線性回歸方程=x+;
(3)試根據(jù)(2)求出的線性回歸方程,預測燃放煙花爆竹的天數(shù)為9的霧霾天數(shù).
8、
[解] (1)散點圖如圖所示.
(2)iyi=4×2+5×3+7×5+8×6=106,
==6,==4,
=42+52+72+82=154,
則===1,
=-=4-6=-2,
故線性回歸方程為=x+=x-2.
(3)由回歸直線方程可以預測,燃放煙花爆竹的天數(shù)為9的霧霾天數(shù)為7.
[能力提升]
9.(20xx·福建卷)為了解某社區(qū)居民的家庭年收入與年支出的關系,隨機調查了該社區(qū)5戶家庭,得到如下統(tǒng)計數(shù)據(jù)表:
收入x(萬元)
8.2
8.6
10.0
11.3
11.9
支出y(萬元)
6.2
7.5
8.0
8.5
9.8
根據(jù)上表可得回歸
9、直線方程=x+,其中=0.76,=- .據(jù)此估計,該社區(qū)一戶年收入為15萬元家庭的年支出為( )
A.11.4萬元 B.11.8萬元
C.12.0萬元 D.12.2萬元
[解析] ∵=10.0,=8.0,=0.76,∴=8-0.76×10=0.4,∴回歸方程為=0.76x+0.4,把x=15代入上式得,=0.76×15+0.4=11.8(萬元),故選B.
[答案] B
10.某車間為了規(guī)定工時定額,需要確定加工零件所花費的時間,為此做了四次試驗,根據(jù)試驗數(shù)據(jù)得到如下圖所示的散點圖,其中x表示零件的個數(shù),y表示加工時間,則y關于x的線性回歸方程是________.
[解析]
10、?。剑?.5,==3.5,
所以==
==0.7.
=-=3.5-0.7×3.5=1.05,
所以線性回歸方程為=0.7x+1.05.
[答案]?。?.7x+1.05
11.(20xx·福建廈門三中模擬)某大型企業(yè)人力資源部為了研究企業(yè)員工工作積極性和對待企業(yè)改革的關系,隨機抽取了100名員工進行調查,其中支持企業(yè)改革的調查者中,工作積極的有46人,工作一般的有35人,而不太贊成企業(yè)改革的調查者中,工作積極的有4人,工作一般的有15人.
(1)根據(jù)以上數(shù)據(jù)建立一個2×2列聯(lián)表;
(2)對于人力資源部的研究項目,根據(jù)以上數(shù)據(jù)可以認為企業(yè)的全體員工對待企業(yè)改革的態(tài)度與其工作積極性是
11、否有關系?
參考公式:K2=(其中n=a+b+c+d)
P(K2≥k0)
0.50
0.40
0.25
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k0
0.455
0.708
1.323
2.072
2.706
3.841
5.024
6.635
7.879
10.828
[解] (1)根據(jù)題設條件,得2×2列聯(lián)表如下:
支持企業(yè)改革
不太贊成企業(yè)改革
總計
工作積極
46
4
50
工作一般
35
15
50
總計
81
19
100
(2)提出假設:企業(yè)的全體員工對待企業(yè)
12、改革的態(tài)度與其工作積極性無關.
根據(jù)(1)中的數(shù)據(jù),可以求得
k=≈7.862>6.635,
所以有99%的把握說抽樣員工對待企業(yè)改革的態(tài)度與工作積極性有關,從而認為企業(yè)的全體員工對待企業(yè)改革的態(tài)度與其工作積極性有關.
12.(20xx·四川遂寧三診)某公司為了解廣告投入對銷售收益的影響,在若干地區(qū)共投入4萬元廣告費用,并將各地的銷售收益繪制成頻率分布直方圖(如圖所示).由于工作人員操作失誤,橫軸的數(shù)據(jù)丟失,但可以確定橫軸是從0開始計數(shù)的.
(1)根據(jù)頻率分布直方圖計算圖中各小矩形的寬度;
(2)試估計該公司投入4萬元廣告費用之后,對應銷售收益的平均值(以各組的區(qū)間中點值代表該
13、組的取值);
(3)該公司按照類似的研究方法,測得另外一些數(shù)據(jù),并整理得到下表:
廣告投入x/萬元
1
2
3
4
5
銷售收益y/萬元
2
3
2
7
由表中的數(shù)據(jù)顯示,x與y之間存在著線性相關關系,請將(2)的結果填入空白欄,并求出y關于x的回歸直線方程.
附參考公式:=,=-.
[解] (1)設各小矩形的寬度為m,由頻率分布直方圖中各小矩形的面積和為1,可知(0.08+0.10+0.14+0.12+0.04+0.02)·m=1,
解得m=2,
故圖中各小矩形的寬度為2.
(2)由(1)知各分組依次是[0,2),[2,4),[4,6),[6,8),[8,10),[10,12],它們的中點的橫坐標分別為1,3,5,7,9,11,
各組對應的頻率分別為0.16,0.20,0.28,0.24,0.08,0.04,
故可估計銷售收益的平均值為1×0.16+3×0.20+5×0.28+7×0.24+9×0.08+11×0.04=5.
(3)由(2)可知空白欄中填5.
由題意可知,==3,==3.8,
iyi=1×2+2×3+3×2+4×5+5×7=69,
=12+22+32+42+52=55,
所以==1.2,=3.8-1.2×3=0.2,
故所求的回歸直線方程為=1.2x+0.2.