《高考數(shù)學 第九章 第四節(jié) 變量間的相關關系、統(tǒng)計案例課件 文 新人教A版》由會員分享,可在線閱讀,更多相關《高考數(shù)學 第九章 第四節(jié) 變量間的相關關系、統(tǒng)計案例課件 文 新人教A版(47頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、第四節(jié)變量間的相關關系、統(tǒng)計案例1兩個變量的線性相關(1)在散點圖中,點散布在從_到_的區(qū)域,對于兩個變量的這種相關關系,我們將它稱為正相關(2)在散點圖中,點散布在從_到_的區(qū)域,兩個變量的這種相關關系稱為負相關(3)如果散點圖中點的分布從整體上看大致在_,就稱這兩個變量之間具有線性相關關系,這條直線叫做回歸直線左下角左下角右上角右上角左上角左上角右下角右下角一條直線附近一條直線附近2回歸方程(1)最小二乘法:使得樣本數(shù)據(jù)的點到回歸直線的_和最小的方法叫最小二乘法距離的平方距離的平方4獨立性檢驗(1)利用隨機變量_來判斷“兩個分類變量_”的方法稱為獨立性檢驗K2有關系有關系(2)列聯(lián)表:列出
2、的兩個分類變量的頻數(shù)表,稱為列聯(lián)表假設有兩個分類變量X和Y,它們的可能取值分別為x1,x2和y1,y2,其樣本頻數(shù)列聯(lián)表(稱為22列聯(lián)表)為22列聯(lián)表y1y2總計總計x1ababx2cdcd總計總計acbdabcd構造一個隨機變量構造一個隨機變量K2_,其中,其中n_為樣本容量為樣本容量 abcd2殘差分析中的相關指數(shù)R2對模型擬合效果的影響是怎樣的?【提示】R2越大,意味著殘差平方和越小,即模型的擬合效果越好R2越小,殘差平方和越大,即模型的擬合效果越差在線性回歸模型中,R2表示解釋變量對于預報變量變化的貢獻率,R2越接近于1,表示回歸的效果越好1(人教A版教材習題改編)某商品銷售量y(件)
3、與銷售價格x(元/件)負相關,則其回歸方程可能是()A.10 x200B.10 x200C.10 x200 D.10 x200【解析】由題意回歸方程斜率應為負,故排除B,D,又銷售量應為正值,故C不正確,故選A.【答案】A2(2013棗莊模擬)下面是22列聯(lián)表:y1y2合計合計x1a2173x2222547合計合計b46120則表中則表中a,b的值分別為的值分別為()A94,72 B52,50C52,74 D74,52【解析】a2173,a52.又a22b,b74.【答案】C【答案】D4(2013錦州質檢錦州質檢)調查了某地若干戶家庭的年收入調查了某地若干戶家庭的年收入x(單位:萬元單位:萬元
4、)和年飲食支出和年飲食支出y(單位:萬元單位:萬元),調查顯示年,調查顯示年收入收入x與年飲食支出與年飲食支出y具有線性相關關系,并由調查數(shù)據(jù)具有線性相關關系,并由調查數(shù)據(jù)得到得到y(tǒng)對對x的回歸直線方程:的回歸直線方程:0.254x0.321.由回歸直線由回歸直線方程可知,家庭年收入每增加方程可知,家庭年收入每增加1萬元,年飲食支出平均萬元,年飲食支出平均增加增加_萬元萬元【解析【解析】由題意知由題意知0.254(x1)0.321(0.254x0.321)0.254.【答案【答案】0.2545在一項打鼾與患心臟病的調查中,共調查了1 671人,經(jīng)過計算K2的觀測值k27.63,根據(jù)這一數(shù)據(jù)分析
5、,我們有理由認為打鼾與患心臟病是_的(填有關或無關)【解析】k27.636.635,有99%的把握認為“打鼾與患心臟病有關”【答案】有關(1)將上述數(shù)據(jù)制成散點圖;(2)你能從散點圖中發(fā)現(xiàn)施化肥量與水稻產(chǎn)量近似成什么關系嗎?水稻產(chǎn)量會一直隨施化肥量的增加而增長嗎?下面是水稻產(chǎn)量與施化肥量的一組觀測數(shù)據(jù):下面是水稻產(chǎn)量與施化肥量的一組觀測數(shù)據(jù): 施化肥量施化肥量15202530354045水稻產(chǎn)量水稻產(chǎn)量320 330360 410 460 470 480【思路點撥】分析觀測數(shù)據(jù)、制圖,分析散點圖,做出判斷【嘗試解答】(1)散點圖如下:(2)從圖中可以發(fā)現(xiàn)施化肥量與水稻產(chǎn)量具有線性相關關系,當施
6、化肥量由小到大變化時,水稻產(chǎn)量由小變大,圖中的數(shù)據(jù)點大致分布在一條直線的附近,因此施化肥量和水稻產(chǎn)量近似成線性相關關系不會,水稻產(chǎn)量只是在一定范圍內隨著化肥施用量的增加而增長 1利用散點圖判斷兩個變量是否有相關關系是比較直觀簡便的方法如果所有的樣本點都落在某一函數(shù)的曲線附近,變量之間就有相關關系如果所有的樣本點都落在某一直線附近,變量之間就有線性相關關系2在散點圖中,若點散布在從左下角到右上角的區(qū)域,稱為正相關;若散布在從左上角到右下角的區(qū)域稱為負相關(2013九江調研)變量X與Y相對應的一組數(shù)據(jù)為(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);變量U與V相對
7、應的一組數(shù)據(jù)為(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1)r1表示變量Y與X之間的線性相關系數(shù),r2表示變量V與U之間的線性相關系數(shù),則()Ar2r10B0r2r1Cr20r1 Dr2r1【解析】對于變量Y與X,Y隨著X的增大而增大,Y與X正相關,即r10.對于變量V與U而言,V隨U的增大而減小,故V與U負相關,即r20,因此r20r1.【答案】C (2013合肥模擬)某地最近十年糧食需求量逐年上升,下表是部分統(tǒng)計數(shù)據(jù):年份年份20042006200820102012需求量需求量(萬噸萬噸)236246257276286【思路點撥】(1)為了方便計算,可將數(shù)
8、據(jù)適當處理,再列對應表格,求回歸系數(shù);(2)根據(jù)回歸方程進行預測分析【嘗試解答】(1)由所給數(shù)據(jù)看出,年需求量與年份之間是近似直線上升,下面來求回歸直線方程,為此對數(shù)據(jù)預處理如下:年份年份200842024需求量需求量257211101929(2)利用直線方程,可預測2014年的糧食需求量為65(2 0142 008)260.26.56260.2299.2(萬噸)300(萬噸) 為了解籃球愛好者小李的投籃命中率與打籃球時間之間的關系,下表記錄了小李某月1號到5號每天打籃球時間x(單位:小時)與當天投籃命中率y之間的關系:時間時間x12345命中率命中率y0.40.50.60.60.4(1)試求
9、小李這試求小李這5天的平均投籃命中率;天的平均投籃命中率;(2)請你用線性回歸分析的方法,預測小李該月請你用線性回歸分析的方法,預測小李該月6號打號打6小小時籃球的投籃命中率時籃球的投籃命中率 (2012遼寧高考改編)電視傳媒公司為了解某地區(qū)電視觀眾對某類體育節(jié)目的收視情況,隨機抽取了100名觀眾進行調查,其中女性有55名下面是根據(jù)調查結果繪制的觀眾日均收看該體育節(jié)目時間的頻率分布直方圖: 將日均收看該體育節(jié)目時間不低于40分鐘的觀眾稱為“體育迷”已知“體育迷”中有10名女性(1)試求“體育迷”中的男性觀眾人數(shù);(2)據(jù)此資料你是否認為“體育迷”與性別有關?附:P(K2k)0.050.01k3
10、.8416.635【思路點撥】(1)根據(jù)頻率分布直方圖求“體育迷”人數(shù),進而確定其中男性觀眾人數(shù)(2)列出22列聯(lián)表,計算K2的觀測值k,依據(jù)獨立性檢驗思想作出判斷【嘗試解答】(1)由頻率分布直方圖,“體育迷”的頻率為(0.0050.020)100.25.“體育迷”觀眾共有1000.2525(名),因此,男“體育迷”共有251015(名)(2)由(1)列22列聯(lián)表如下:非體育迷非體育迷體育迷體育迷合計合計男男301545女女451055合計合計7525100為調查某地區(qū)老年人是否需要志愿者提供幫助,用簡單隨機抽樣方法從該地區(qū)調查了500位老年人,結果如下:性別性別是否需要志愿者是否需要志愿者男
11、男女女需要需要4030不需要不需要160270(1)估計該地區(qū)老年人中,需要志愿者提供幫助的老年人估計該地區(qū)老年人中,需要志愿者提供幫助的老年人的比例;的比例;(2)在犯錯誤的概率不超過在犯錯誤的概率不超過1%的條件下,你能否認為該的條件下,你能否認為該地區(qū)的老年人是否需要志愿者提供幫助與性別有關?地區(qū)的老年人是否需要志愿者提供幫助與性別有關?(3)根據(jù)(2)的結論,能否提出更好的調查方法來估計該地區(qū)的老年人中,需要志愿者提供幫助的老年人的比例?說明理由附:(3)由(2)的結論知,該地區(qū)老年人是否需要幫助與性別有關,并且從樣本數(shù)據(jù)能看出該地區(qū)男性老年人與女性老年人中需要幫助的比例有明顯差異,因
12、此在調查時,先確定該地區(qū)老年人中男、女的比例,再把老年人分成男、女兩層并采用分層抽樣方法,比采用簡單隨機抽樣方法更好1.函數(shù)關系是一種確定的關系,相關關系是一種非確定的關系事實上,相關關系是非隨機變量與隨機變量的關系2當K23.841時,則有95%的把握說事件A與B有關;當K22.706時,認為兩個分類變量無關 1.回歸分析是對具有相關關系的兩個變量進行統(tǒng)計分析的方法,只有在散點圖大致呈線性時,求出的回歸直線方程才有實際意義2線性回歸方程中的截距和斜率都是通過樣本數(shù)據(jù)估計而來的,存在誤差,這種誤差會導致預報結果的偏差3獨立性檢驗的隨機變量K2的觀測值k3.841是判斷是否有關系的臨界值,K2的
13、觀測值k3.841應判斷為沒有充分證據(jù)顯示事件A與B有關系,而不能作為小于95%的量化值來判斷 從近兩年高考看,以考查獨立性檢驗,回歸分析為從近兩年高考看,以考查獨立性檢驗,回歸分析為主,多為選擇題、填空題,也可能以解答題形式考查,主,多為選擇題、填空題,也可能以解答題形式考查,主要以實際問題為背景,考查閱讀理解、分析問題、解主要以實際問題為背景,考查閱讀理解、分析問題、解決問題的能力,在解決一些簡單實際問題的過程中考查決問題的能力,在解決一些簡單實際問題的過程中考查基本的統(tǒng)計思想基本的統(tǒng)計思想 (2012福建高考)某工廠為了對新研發(fā)的一種產(chǎn)品進行合理定價,將該產(chǎn)品按事先擬定的價格進行試銷,得
14、到如下數(shù)據(jù):思想方法之十七利用回歸分析思想進行科學預測思想方法之十七利用回歸分析思想進行科學預測單價單價x(元元)88.28.48.68.89銷量銷量y(件件)908483807568【解析】由于線性回歸方程中x的系數(shù)為0.85,因此y與x具有正的線性相關關系,故A正確又線性回歸方程必過樣本中心點 ,因此B正確由線性回歸方程中系數(shù)的意義知,x每增加1 cm,其體重約增加0.85 kg,故C正確當某女生的身高為170 cm時,其體重估計值是58.79 kg,并不一定就是58.79 kg,因此D不正確【答案】D2(2013深圳模擬)通過隨機詢問110名性別不同的大學生是否愛好某項運動,得到如下的列聯(lián)表:男男女女總計總計愛好愛好402060不愛好不愛好203050總計總計6050110參照附表,得到的正確結論是()A在犯錯誤的概率不超過0.1%的前提下,認為“愛好該項運動與性別有關”B在犯錯誤的概率不超過0.1%的前提下,認為“愛好該項運動與性別無關”附表:附表:P(K2k)0.0500.0100.001k3.8416.63510.828C有99%以上的把握認為“愛好該項運動與性別有關”D有99%以上的把握認為“愛好該項運動與性別無關”【解析】由相關系數(shù)K2的意義,附表所對應的概率為“愛好該運動與性別有關”,有99%以上的把握認為“愛好該項運動與性別有關”【答案】C