《(全國通用版)2019高考數(shù)學二輪復習 專題四 概率與統(tǒng)計 第1講 統(tǒng)計與統(tǒng)計案例課件 文.ppt》由會員分享,可在線閱讀,更多相關《(全國通用版)2019高考數(shù)學二輪復習 專題四 概率與統(tǒng)計 第1講 統(tǒng)計與統(tǒng)計案例課件 文.ppt(47頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、第1講統(tǒng)計與統(tǒng)計案例,高考定位1.抽樣方法、樣本的數(shù)字特征、統(tǒng)計圖表、回歸分析與獨立性檢驗主要以選擇題、填空題形式命題,難度較小;2.注重知識的交匯滲透,統(tǒng)計與概率,回歸分析與概率是近年命題的熱點,2016年,2017年和2018年在解答題中均有考查.,1.(2018全國卷)某地區(qū)經(jīng)過一年的新農(nóng)村建設,農(nóng)村的經(jīng)濟收入增加了一倍,實現(xiàn)翻番.為更好地了解該地區(qū)農(nóng)村的經(jīng)濟收入變化情況,統(tǒng)計了該地區(qū)新農(nóng)村建設前后農(nóng)村的經(jīng)濟收入構成比例,得到如圖所示的餅圖:,真 題 感 悟,,則下面結論中不正確的是() A.新農(nóng)村建設后,種植收入減少 B.新農(nóng)村建設后,其他收入增加了一倍以上 C.新農(nóng)村建設后,養(yǎng)殖收入
2、增加了一倍 D.新農(nóng)村建設后,養(yǎng)殖收入與第三產(chǎn)業(yè)收入的總和超過了經(jīng)濟收入的一半,解析設新農(nóng)村建設前經(jīng)濟收入為a,則新農(nóng)村建設后經(jīng)濟收入為2a,則由餅圖可得新農(nóng)村建設前種植收入為0.6a,其他收入為0.04a,養(yǎng)殖收入為0.3a.新農(nóng)村建設后種植收入為0.74a,其他收入為0.1a,養(yǎng)殖收入為0.6a,養(yǎng)殖收入與第三產(chǎn)業(yè)收入的總和為1.16a,所以新農(nóng)村建設后,種植收入減少是錯誤的. 答案A,2.(2018全國卷)某公司有大量客戶,且不同年齡段客戶對其服務的評價有較大差異.為了解客戶的評價,該公司準備進行抽樣調查,可供選擇的抽樣方法有簡單隨機抽樣、分層抽樣和系統(tǒng)抽樣,則最合適的抽樣方法是____
3、____. 解析因為不同年齡段的客戶對公司的服務評價有較大差異,所以需按年齡進行分層抽樣,才能了解到不同年齡段的客戶對公司服務的客觀評價. 答案分層抽樣,3.(2018全國卷)下圖是某地區(qū)2000年至2016年環(huán)境基礎設施投資額y(單位:億元)的折線圖.,,(2)利用模型得到的預測值更可靠. 理由如下:,1.抽樣方法 抽樣方法包括簡單隨機抽樣、系統(tǒng)抽樣、分層抽樣,三種抽樣方法都是等概率抽樣,體現(xiàn)了抽樣的公平性,但又各有其特點和適用范圍. 2.統(tǒng)計中的四個數(shù)據(jù)特征 (1)眾數(shù):在樣本數(shù)據(jù)中,出現(xiàn)次數(shù)最多的那個數(shù)據(jù). (2)中位數(shù):樣本數(shù)據(jù)中,將數(shù)據(jù)按大小排列,位于最中間的數(shù)據(jù).如果數(shù)據(jù)的個數(shù)為偶
4、數(shù),就取中間兩個數(shù)據(jù)的平均數(shù)作為中位數(shù).,考 點 整 合,3.直方圖的兩個結論,4.回歸分析與獨立性檢驗,(2)獨立性檢驗 對于取值分別是x1,x2和y1,y2的分類變量X和Y,其樣本頻數(shù)列聯(lián)表是:,熱點一抽樣方法 【例1】 (1)(2018合肥模擬)某校為了解學生學習的情況,采用分層抽樣的方法從高一 1 000人、高二1 200人、高三n人中抽取81人進行問卷調查,已知高二被抽取的人數(shù)為30,那么n() A.860 B.720 C.1 020 D.1 040,(2)(2018長沙雅禮中學質檢)在一次馬拉松比賽中,35名運動員的成績(單位:分鐘)的莖葉圖如圖所示:,,若將運動員按成績由好到差編
5、為135號,再用系統(tǒng)抽樣方法從中抽取7人,則其中成績在區(qū)間139,151上的運動員人數(shù)是________.,(2)依題意,可將編號為135號的35個數(shù)據(jù)分成7組,每組有5個數(shù)據(jù). 在區(qū)間139,151上共有20個數(shù)據(jù),分在4個小組內,每組抽取1人,共抽取4人.,答案(1)D(2)4,探究提高1.解決此類題目的關鍵是深刻理解各種抽樣方法的特點和適用范圍.但無論哪種抽樣方法,每一個個體被抽到的概率都是相等的,都等于樣本容量與總體容量的比值.,【訓練1】 (1)(2018鄭州模擬)為規(guī)范學校辦學,某省教育廳督察組對某所高中進行了抽樣調查.抽到的班級一共有52名學生,現(xiàn)將該班學生隨機編號,用系統(tǒng)抽樣的
6、方法抽取一個容量為4的樣本,已知7號、33號、46號同學在樣本中,那么樣本中還有一位同學的編號應是() A.13 B.19 C.20 D.51 (2)某工廠生產(chǎn)甲、乙、丙、丁四種不同型號的產(chǎn)品,產(chǎn)量分別為200,400,300,100件,為檢驗產(chǎn)品的質量,現(xiàn)用分層抽樣的方法從以上所有的產(chǎn)品中抽取60件進行檢驗,則應從丙種型號的產(chǎn)品中抽取________件.,解析(1)由系統(tǒng)抽樣的原理知,抽樣的間隔為52413,故抽取的樣本的編號分別為7,713,7132,7133,即7號,20號,33號,46號. 樣本中還有一位同學的編號為20號.,答案(1)C(2)18,熱點二用樣本估計總體 考法1數(shù)字特征
7、與莖葉圖的應用 【例21】 (2018北京東城區(qū)質檢)某班男女生各10名同學最近一周平均每天的鍛煉時間(單位:分鐘)用莖葉圖記錄如下:,,,假設每名同學最近一周平均每天的鍛煉時間是互相獨立的. 男生每天鍛煉的時間差別小,女生每天鍛煉的時間差別大; 從平均值分析,男生每天鍛煉的時間比女生多; 男生平均每天鍛煉時間的標準差大于女生平均每天鍛煉時間的標準差; 從10個男生中任選一人,平均每天的鍛煉時間超過65分鐘的概率比同樣條件下女生鍛煉時間超過65分鐘的概率大. 其中符合莖葉圖所給數(shù)據(jù)的結論是() A. B. C. D.,解析由莖葉圖知,男生每天鍛煉時間差別小,女生差別大,正確.,s甲
8、, 因此符合莖葉圖所給數(shù)據(jù)的結論是. 答案C,考法2用樣本的頻率分布估計總體分布 【例22】 (2017北京卷)某大學藝術專業(yè)400名學生參加某次測評,根據(jù)男女學生人數(shù)比例,使用分層抽樣的方法從中隨機抽取了100名學生,記錄他們的分數(shù),將數(shù)據(jù)分成7組:20,30),30,40),80,90,并整理得到如下頻率分布直方圖:,,(1)從總體的400名學生中隨機抽取一人,估計其分數(shù)小于70的概率; (2)已知樣本中分數(shù)小于40的學生有5人,試估計總體中分數(shù)在區(qū)間40,50)內的人數(shù); (3)已知樣本中有一半男生的分數(shù)不小于70,且樣本中分數(shù)不小于70的男女生人數(shù)相等.試估計總體中男生和女生人數(shù)的比例
9、.,解(1)根據(jù)頻率分布直方圖可知,樣本中分數(shù)不小于70的頻率為(0.020.04)100.6, 所以樣本中分數(shù)小于70的頻率為10.60.4. 所以從總體的400名學生中隨機抽取一人,其分數(shù)小于70的概率估計為0.4.,(2)根據(jù)題意,樣本中分數(shù)不小于50的頻率為(0.010.020.040.02)100.9, 分數(shù)在區(qū)間40,50)內的人數(shù)為1001000.955.,(3)由題意可知,樣本中分數(shù)不小于70的學生人數(shù)為(0.020.04)1010060,,所以樣本中的男生人數(shù)為30260,女生人數(shù)為1006040,男生和女生人數(shù)的比例為604032. 所以根據(jù)分層抽樣原理,總體中男生和女生人
10、數(shù)的比例估計為32.,探究提高1.平均數(shù)與方差都是重要的數(shù)字特征,是對數(shù)據(jù)的一種簡明描述,它們所反映的情況有著重要的實際意義.平均數(shù)、中位數(shù)、眾數(shù)描述數(shù)據(jù)的集中趨勢,方差和標準差描述數(shù)據(jù)的波動大小. 2.在本例22中,抓住頻率分布直方圖各小長方形的面積之和為1,這是求解的關鍵;本題易混淆頻率分布條形圖和頻率分布直方圖,誤把頻率分布直方圖縱軸的幾何意義當成頻率,導致樣本數(shù)據(jù)的頻率求錯.,【訓練2】 (1)如圖所示的莖葉圖記錄了甲乙兩組各5名工人某日的產(chǎn)量數(shù)據(jù)(單位:件).若這兩組數(shù)據(jù)的中位數(shù)相等,且平均值也相等,則x和y的值分別為(),A.3,5 B.5,5 C.3,7 D.5,7,答案A,(2
11、)我國是世界上嚴重缺水的國家,某市為了制定合理的節(jié)水方案,對居民用水情況進行了調查.通過抽樣,獲得了某年100位居民每人的月均用水量(單位:噸),將數(shù)據(jù)按照0,0.5),0.5,1),,4,4.5分成9組,制成了如圖所示的頻率分布直方圖.,求直方圖中a的值; 設該市有30萬居民,估計全市居民中月均用水量不低于3噸的人數(shù),說明理由; 估計居民月均用水量的中位數(shù).,解由頻率分布直方圖可知:月均用水量在0,0.5)內的頻率為0.080.50.04. 同理,在0.5,1),1.5,2),2,2.5),3,3.5),3.5,4),4,4.5等組的頻率分別為0.08,0.21,0.25,0.06,0.04
12、,0.02. 由1(0.040.080.210.250.060.040.02)0.5a0.5a,解得a0.30. 由知,該市100位居民中月均用水量不低于3噸的頻率為0.060.040.020.12.由以上樣本的頻率分布,可以估計30萬居民中月均用水量不低于3噸的人數(shù)為 300 0000.1236 000.,設中位數(shù)為x噸. 因為前5組的頻率之和為0.040.080.150.210.250.730.5. 又前4組的頻率之和為0.040.080.150.210.48<0.5. 所以2x<2.5. 由0.50(x2)0.50.48,解得x2.04. 故可估計居民月均用水量的中位數(shù)為2.04噸.,熱
13、點三回歸分析 【例3】 (2018成都質檢)某省的一個氣象站觀測點在連續(xù)4天里記錄的AQI指數(shù)M與當天的空氣水平可見度y(單位:cm)的情況如表1:,該省某市2017年11月份AQI指數(shù)頻數(shù)分布如表2:,(2)小李在該市開了一家洗車店,洗車店每天的平均收入與AQI指數(shù)存在相關關系如表3:,根據(jù)表3估計小李的洗車店2017年11月份每天的平均收入.,(2)根據(jù)表3可知,該月30天中有3天每天虧損2 000元,有6天每天虧損1 000元,有12天每天收入2 000元,有6天每天收入6 000元,有3天每天收入8 000元.,【訓練3】 (2016全國卷)如圖是我國2008年至2014年生活垃圾無害
14、化處理量(單位:億噸)的折線圖.,注:年份代碼17分別對應年份20082014.,,(1)由折線圖看出,可用線性回歸模型擬合y與t的關系,請用相關系數(shù)加以說明; (2)建立y關于t的回歸方程(系數(shù)精確到0.01),預測2016年我國生活垃圾無害化處理量. 附注:,解(1)由折線圖中數(shù)據(jù)和附注中參考數(shù)據(jù)得,因為y與t的相關系數(shù)近似為0.99,說明y與t的線性相關程度相當高,從而可以用線性回歸模型擬合y與t的關系.,所以預測2016年我國生活垃圾無害化處理量將約為1.82億噸.,熱點四獨立性檢驗 【例4】 (2018全國卷)某工廠為提高生產(chǎn)效率,開展技術創(chuàng)新活動,提出了完成某項生產(chǎn)任務的兩種新的生
15、產(chǎn)方式.為比較兩種生產(chǎn)方式的效率,選取40名工人,將他們隨機分成兩組,每組20人,第一組工人用第一種生產(chǎn)方式,第二組工人用第二種生產(chǎn)方式.根據(jù)工人完成生產(chǎn)任務的工作時間(單位:min)繪制了如圖所示的莖葉圖:,(1)根據(jù)莖葉圖判斷哪種生產(chǎn)方式的效率更高?并說明理由;,(2)求40名工人完成生產(chǎn)任務所需時間的中位數(shù)m,并將完成生產(chǎn)任務所需時間超過m和不超過m的工人數(shù)填入下面的列聯(lián)表:,(3)根據(jù)(2)中的列聯(lián)表,能否有99%的把握認為兩種生產(chǎn)方式的效率有差異?,(2)由莖葉圖數(shù)據(jù)得到m80.由此填寫列聯(lián)表如下:,(3)根據(jù)(2)中的列聯(lián)表計算.,探究提高1.獨立性檢驗的一般步驟 (1)根據(jù)樣本數(shù)
16、據(jù)制成22列聯(lián)表;,(3)查表比較K2與臨界值的大小關系,作統(tǒng)計判斷. 2.K2的觀測值k越大,對應假設事件H0成立(兩類變量相互獨立)的概率越小,H0不成立的概率越大.,【訓練4】 微信是騰訊公司推出的一種手機通訊軟件,它支持發(fā)送語音短信、視頻、圖片和文字,一經(jīng)推出便風靡全國,甚至涌現(xiàn)出一批在微信的朋友圈內銷售商品的人(被稱為微商).為了調查每天微信用戶使用微信的時間,某經(jīng)銷化妝品的微商在一廣場隨機采訪男性、女性用戶各50名,將男性、女性使用微信的時間分成5組:(0,2,(2,4,(4,6,(6,8,(8,10分別加以統(tǒng)計,得到如圖所示的頻率分布直方圖.,(1)根據(jù)女性頻率分布直方圖估計女性
17、使用微信的平均時間; (2)若每天玩微信超過4小時的用戶列為“微信控”,否則稱其為“非微信控”,請你根據(jù)已知條件完成22的列聯(lián)表,并判斷是否有90%的把握認為“微信控”與“性別有關”?,解(1)女性平均使用微信的時間為: 0.1610.2430.2850.270.1294.76(小時).,(2)由已知得:2(0.04a0.1420.12)1,解得a0.08. 由題設條件得列聯(lián)表,所以有90%的把握認為“微信控”與“性別”有關.,1.用樣本估計總體是統(tǒng)計的基本思想. 用樣本頻率分布來估計總體分布的重點是頻率分布表和頻率分布直方圖的繪制及用樣本頻率分布估計總體分布;難點是頻率分布表和頻率分布直方圖
18、的理解及應用. 2.(1)眾數(shù)、中位數(shù)及平均數(shù)都是描述一組數(shù)據(jù)集中趨勢的量,平均數(shù)是最重要的量,與每個樣本數(shù)據(jù)有關,這是中位數(shù)、眾數(shù)所不具有的性質. (2)標準差、方差描述了一組數(shù)據(jù)圍繞平均數(shù)波動的大小.標準差、方差越大,數(shù)據(jù)的離散程度就越大.,3.莖葉圖、頻率分布表和頻率分布直方圖都可直觀描述樣本數(shù)據(jù)的分布規(guī)律. 在頻率分布直方圖中,可分析樣本數(shù)據(jù)的分布情況,大致判斷平均數(shù)的范圍,并利用數(shù)據(jù)的波動性大小反映方差(標準差)的大小.,4.回歸分析是對具有相關關系的兩個變量進行統(tǒng)計分析的方法,只有在散點圖大致呈線性時,求出的線性回歸方程才有實際意義,否則,求出的線性回歸方程毫無意義.根據(jù)回歸方程進行預報,僅是一個預報值,而不是真實發(fā)生的值.,