《河北省正定中學2020屆高考數學一輪復習 統(tǒng)計學案 理(無答案)》由會員分享,可在線閱讀,更多相關《河北省正定中學2020屆高考數學一輪復習 統(tǒng)計學案 理(無答案)(7頁珍藏版)》請在裝配圖網上搜索。
1、河北省正定中學2020屆高考數學一輪復習 統(tǒng)計學案 理(無答案)
一、 基礎知識整理
統(tǒng)計的基本思想是用樣本去估計總體。為使樣本能更好的反映總體,抽取樣本要具有代表性和公平性。
1. 抽樣方法:
(1) 簡單的隨機抽樣:一般地,設一個總體有有限個個體,并記其個數為N,如果通過逐個抽取的方法,從中抽取一個樣本,且每次抽取時,各個個體被抽取的概率相等,就稱這樣的抽樣為簡單隨機抽樣。
兩種常用的方法:①抽簽法;②隨機數表法。它適用于總體所含個體數較少的情況。
(2) 系統(tǒng)抽樣:當總體中的個體數較多時,可將總體分成均衡的幾個部分,然后按照預先定出的規(guī)則,從每一部分抽取一個個體,得到所需要的
2、樣本,這種抽樣叫做系統(tǒng)抽樣。當均分時,總體個數不能被整除,則可隨機的剔除幾個個體。
(3) 分層抽樣:當已知總體由差異明顯的幾部分組成時,為了使樣本更能充分地反映總體情況,常將總體分成幾部分,然后按照各部分所占的比進行抽樣,這種抽樣叫做分層抽樣,其中所分成的各部分叫做層。
顯然,簡單的隨機抽樣是系統(tǒng)抽樣和分層抽樣的基礎。
2. 總體分布的估計
(1) 總體分布:總體取值的概率分布規(guī)律通常稱為總體分布??傮w分布往往是不易知道的,所以要用樣本的頻率分布支估計總體分布。一般地,樣本容量越大,估計就越精確。
(2) 樣本頻率分布:樣本所有數據(或數據組)的頻率的分布變化規(guī)律,稱為樣本頻率分布
3、。
(3) 樣本頻率分布的表示方法有頻率分布表、頻率分布條形圖、頻率分布直方圖。要特別注意:頻率分布條形圖的高度是頻率,而頻率分布直方圖的高度是頻率與組距的比,這為后邊用面積表示頻率或概率提供了方便。
(4) 總體密度曲線:設想樣本容量無限增大,分組的組距無限縮小,那么頻率分布直方圖就會無限接近于一條光滑曲線——總體密度曲線??傮w地某一區(qū)間內的概率等于總體密度曲線與橫軸及過區(qū)間兩端點且與橫軸垂直的兩條平行線圍成的圖形的面積(如圖)??傮w密度曲線與軸之間的區(qū)域的面積為1,它表示總體在區(qū)間內的分布的概率為1。
3. 正態(tài)分布:
(1) 總體密度曲線是可近似地是函數,(σ>0)圖象的分布稱為
4、分布(這個總體是有無限容量的抽象總體)。這個函數的圖象叫做正態(tài)曲線。
(2) 正態(tài)曲線具有以下性質:工
① 曲線在軸的上方,與軸不相交;
② 曲線關于直線對稱;
③ 曲線在時,位于最高點;
④ 當時,曲線上升;當時,曲線下降,并且當曲線向左、右兩邊無限延伸時,以軸為漸近線,向它無限靠近。
⑤ 當一定時,曲線的形狀由確定。越大,曲線越“矮胖”,表示總體的分布越分散;越小,曲線越“瘦高”,表示總體的分布越集中。
(3) 標準正態(tài)總體:總體密度曲線是函數,(-∞<x<+∞)的圖象的總體稱為標準正態(tài)總體,相應的曲線稱為標準正態(tài)曲線。標準正態(tài)曲線的對稱軸是軸。它是,(σ>0)的特例。
(
5、4) 標準正態(tài)分布下的概率計算:
① 在標準正態(tài)分布表中,表示的是總體取值小于的概率,即。
② 兩個重要公式:;
③ 一般的正態(tài)總體都能化為標準正態(tài)總體來計算,即一般正態(tài)總體取值小于的概率。
(5) 小概率事件:正態(tài)總體在區(qū)間以外的概率只有4.6%,在區(qū)間外的概率只有0.3%,由于這些概率值很小,通常稱這些情況發(fā)生為小概率事件。
4. 線性回歸
(1) 相關關系:當自變量的取值一定時,因變量的取值帶有一定的隨機性的兩個變量之間的關系叫做相關關系。相關關系是一種非確定性關系。
(2) 回歸分析:對具有相關關系的兩個變量進行統(tǒng)計分析的方法叫做回歸分析。
(3) 線性回歸分析:
①
6、 散點圖:表示具有相關關系的兩個變量的一組數據的圖形,叫做散點圖;
② 回歸直線方程:兩個具有相關關系的變量的散點圖中的點,大致分布在一條直線上,并且由確定的直線方程叫做回歸直線方程,相應的直線叫做回歸直線,而對上述兩個變量所進行的統(tǒng)計分析叫做線性回歸分析。
(4) 線性相關顯著性質檢驗:對于變量與的一組觀測值來說,把
叫做變量與之間的樣本相關系數(), 當時,與之間不具有線性相關關系,當時,與之間具有線性相關關系。在求回歸直線方程時,應先進行線性相關性檢驗。
二、 練習題
(一)選擇題:
1. 正態(tài)曲線是 ( )
A.遞增函數;B.遞減函數;C.從左到右先增后減的
7、函數;D.從左到右先減后增的函數
2. 一個容量為20的樣本,已知某組的頻率為0.25,則該組的頻數為 ( )
A.2 B.5 C.15 D.80
3. 右圖所示是一批產品中抽樣得到數據的頻率分布直方圖,由圖
中可看出概率最大時數據所落在的范圍是 ( )
A.(8.1,8.3)B.(8.2,8.4)C.(8.4,8.5)D.(8.5,8.7)
4. 以表示標準正態(tài)總體在區(qū)間內取值的概率,若隨機變量服從正態(tài)分布,則概率等于?。? )
(A)?(B)?。–)?(D)
5. 在線性回歸中,點 是散點圖中個點的( )
A.內心 B.外心 C.重
8、心 D.垂心
6. 設隨機變量服從標準正態(tài)分布,已知,則=( )
A.0.025??????B.0.050????? C.0.950????? D.0.975
7. 某班50名學生在一次百米測試中,成績全部介于13秒與19秒之間,將測試結果按如下方式分成六組:第一組,成績大于等于13秒且小于14秒;第二組,成績大于等于14秒且小于15秒;第六組,成績大于等于18秒且小于等于19秒.右圖是按上述分組方法得到的頻率分布直方圖.設成績小于17秒的學生人數占全班總人數的百分比為,成績大于等于15秒且小于17秒的學生人數為,則從頻率分布直方圖中可分析出和分別為( )
A.0.9, 35??
9、? B.0.9,45 C.0.1,20 D.0.1,40.
8. 某商場有四類食品,其中糧食類、植物油類、動物性食品類及果蔬類分別有40種、10種、30種、20種,現從中抽取一個容量為20的樣本進行食品安全檢測。若采用分層抽樣的方法抽取樣本,則抽取的植物油類與果蔬類食品種數之和是( )
A 4????????????? B 5???????????C 6???????????? D 7
9. 某中學有高級教師28人,中級教師54人,初級教師81人,為了調查他們的身體狀況,從他們中抽取容量為36的樣本,最適合抽取樣本的方法是( )
A、簡單隨機抽樣; B、系統(tǒng)抽樣
10、;
C、分層抽樣?; D、先從高級教師中隨機剔除1人,再用分層抽樣
10. 為了考察兩個變量x和y之間的線性相關性,甲、乙兩個同學各自獨立地做了10次和15次試驗,并且利用線性回歸方法,求得回歸直線分別為l1和l2.已知兩個人在試驗中發(fā)現對變量x的觀測數據的平均數都為s,對變量y的觀測數據的平均數都為t,那么下列說法正確的是 ( )
A.l1與l2有交點(s,t) B.l1與l2相交,但交點不一定是(s,t)
C.l1與l2必定平行 D.l1與l2必定重合
(二)填空題:本大題共4小題,每小題4分,共16分,把答案填在題中橫線上.
11. 一個總體含有100個個體
11、,以簡單隨機抽樣方式從該總體中抽取一個容量為5的樣本,則指定的某個個體被抽到的概率為??????? .
12. 某自動包裝機包裝的食鹽中,隨機抽取20袋,測得各袋的質量分別為(單位:g):
492
496
494
495
498
497
501
502
504
496
497
503
506
508
507
492
496
500
501
499
根據頻率分布估計總體分布的原理,該自動包裝機包裝的袋裝食鹽質量在497.5g~501.5g之間的概率約為_____.
13. 某校有學生2000人,其中高三學生500人.為了解學生的身體素質情況,采
12、用按年級分層抽樣的方法,從該校學生中抽取一個200人的樣本.則樣本中高三學生的人數為_____.
14. 設隨機變量服從正態(tài)分布N(0,1),記,給出下列結論:①;②;③;④ 其中正確的序號是?????????。
15. 為了了解高三學生的身體狀況。抽取了部分男生的體重,將所得的數據整理后,畫出了頻率分布直方圖(如圖),已知圖中從左到右的前3個小組的頻率之比為1︰2︰3,第2小組的頻數為12,則抽取的男生人數是???????。
16. 某校共有2500名學生,其中男生1300名,女生1200名,用分層抽樣法抽取一個容量為200的樣本,則男生應抽取 名.
(三)解答題:本大題
13、共6小題,共74分.解答應寫出文字說明,證明過程和演算步驟.
17. (本小題滿分12分)下表給出了某校120名12歲男孩的身高資料(單位:cm)
身高
[122,126
[126,130
[130,134
[134,138
[138,142
[142,146
[146,150
[150,154
[154,158
人數
5
8
10
22
33
20
11
6
5
(1)列出樣本的頻率分布表;(2)繪出頻率分布直方圖;
(3)根據樣本的頻率分布,估計身高小于134cm的男孩所占的百分比.
18. 為了解某學校高一男生的身體發(fā)育情況,用系統(tǒng)抽樣法從
14、中抽取了一個容量為40的樣本,用測得的體重數據繪出的頻率分布直方圖如下圖。根據頻率分布直方圖,估計該校男生體重大于56.5kg的概率是多少?
19. 在學校舉行的數學競賽中,全體參賽學生的成績近似服從正態(tài)分布N(70,100)。已知成績在85分以上(含85分)的學生有20名。如果要對成績排在前15名的學生進行獎勵,設獎的分數線怎樣確定?
20. 某種魚的飼養(yǎng)時間(月數)與個體體重(kg)的統(tǒng)計資料如下表:
飼養(yǎng)月數
2
3
4
5
6
個體體重
2.2
3.8
5.5
6.5
7.0
(1) 資料中變量與之間有線性相關關系嗎(可用散點圖確定)?
(2) 若資料中的與具有線性相關關系,求對的回歸直線方程,并估計飼養(yǎng)7個月時,這種魚個體的體重。
答案:1-10題:CBCBC CACDA 11、0.05 12、0.25 13、50 14①②③ 15、48
16、104 17、(1)略;(2)略; (3)約19%. 18、0.3475 19、86.5分 20、(1)略;(2)12.4kg