抽樣調(diào)查-多階段抽樣培訓(xùn)課件
《抽樣調(diào)查-多階段抽樣培訓(xùn)課件》由會員分享,可在線閱讀,更多相關(guān)《抽樣調(diào)查-多階段抽樣培訓(xùn)課件(47頁珍藏版)》請?jiān)谘b配圖網(wǎng)上搜索。
1、返回8.1 引 言 前面提到的整群抽樣雖然前面提到的整群抽樣雖然有很多優(yōu)點(diǎn),但是由于群內(nèi)單有很多優(yōu)點(diǎn),但是由于群內(nèi)單元通常具有相似性(表現(xiàn)為群元通常具有相似性(表現(xiàn)為群內(nèi)相關(guān)系數(shù)大于零)。尤其是內(nèi)相關(guān)系數(shù)大于零)。尤其是當(dāng)群比較大時,人們自然會想當(dāng)群比較大時,人們自然會想到?jīng)]有必要對群內(nèi)所有單元都到?jīng)]有必要對群內(nèi)所有單元都進(jìn)行調(diào)查,而只要對群內(nèi)單元進(jìn)行調(diào)查,而只要對群內(nèi)單元進(jìn)行再抽樣,對被抽中的單元進(jìn)行再抽樣,對被抽中的單元進(jìn)行調(diào)查,這就是常用的多階進(jìn)行調(diào)查,這就是常用的多階段抽樣。段抽樣。返回一、多階段抽樣的定義 先在總體單元(初級單元)中抽出樣本單先在總體單元(初級單元)中抽出樣本單元,并
2、不對這個樣本單元中的所有下一級單元元,并不對這個樣本單元中的所有下一級單元(二級單元)都進(jìn)行調(diào)查,而是在其中再抽出若(二級單元)都進(jìn)行調(diào)查,而是在其中再抽出若干個二級單元并進(jìn)行調(diào)查。干個二級單元并進(jìn)行調(diào)查。這種抽樣方法稱為二階段抽樣。同樣的道這種抽樣方法稱為二階段抽樣。同樣的道理,還可以有三階段抽樣、四階段抽樣等。對于理,還可以有三階段抽樣、四階段抽樣等。對于二階段以上的抽樣,二階段以上的抽樣,統(tǒng)稱為統(tǒng)稱為多階段抽樣多階段抽樣。返回二、多階段抽樣的優(yōu)點(diǎn)(1)(1)多階段抽樣保持了整群抽樣的樣本比較集中、多階段抽樣保持了整群抽樣的樣本比較集中、便于調(diào)查、節(jié)約費(fèi)用等優(yōu)點(diǎn)。便于調(diào)查、節(jié)約費(fèi)用等優(yōu)點(diǎn)。
3、(2)(2)多階段抽樣不需要編制所有小單元的樣本框。多階段抽樣不需要編制所有小單元的樣本框。三、抽選方法與推斷原理 多階段抽樣時,每一個階段的抽樣可以相同,也多階段抽樣時,每一個階段的抽樣可以相同,也可以不同。它通常與分層抽樣、整群抽樣、系統(tǒng)抽樣可以不同。它通常與分層抽樣、整群抽樣、系統(tǒng)抽樣結(jié)合使用。多階段抽樣時,抽樣是分步進(jìn)行的,因此,結(jié)合使用。多階段抽樣時,抽樣是分步進(jìn)行的,因此,討論估計(jì)量的均值及其方差時,需要分階段進(jìn)行這要討論估計(jì)量的均值及其方差時,需要分階段進(jìn)行這要用到下面的性質(zhì)用到下面的性質(zhì)。返回性質(zhì)1 對于兩階段抽樣,有式中,式中,為在固定初級單元時對第二階抽樣求均為在固定初級單
4、元時對第二階抽樣求均值和方差;值和方差;為對第一階抽樣求均值和方差。為對第一階抽樣求均值和方差。性質(zhì)性質(zhì)1 1可以推廣到多階段抽樣的情形,例如可以推廣到多階段抽樣的情形,例如對于三階段抽樣,有對于三階段抽樣,有返回8.2 初級單元大小相等的二階抽樣第一階段在總體第一階段在總體N N個初級單元中,以簡單隨機(jī)個初級單元中,以簡單隨機(jī)抽樣抽取抽樣抽取n n個初級單元,第二階段在被抽中的初級個初級單元,第二階段在被抽中的初級單元包含的單元包含的M M個二級單元中,以簡單隨機(jī)抽樣抽取個二級單元中,以簡單隨機(jī)抽樣抽取m m個二級單元,即最終接受調(diào)查的單元個二級單元,即最終接受調(diào)查的單元。例如:某個新開發(fā)的
5、小區(qū)擁有相同戶型的例如:某個新開發(fā)的小區(qū)擁有相同戶型的1515個個單元的樓盤,居民已經(jīng)陸續(xù)搬入新居,每個單元住單元的樓盤,居民已經(jīng)陸續(xù)搬入新居,每個單元住有有1212戶居民,為調(diào)查居民家庭裝修情況,準(zhǔn)備從戶居民,為調(diào)查居民家庭裝修情況,準(zhǔn)備從180180戶居民戶中抽取戶居民戶中抽取2020戶進(jìn)行調(diào)查。如下表:戶進(jìn)行調(diào)查。如下表:返回編號單 元 房 號123456789101112131415一棟A座一棟B座一棟C座二棟A座二棟B座二棟C座三棟A座三棟B座三棟C座四棟A座四棟B座四棟C座五棟A座五棟B座五棟C座 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8
6、 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9
7、10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 返回表中紅字為抽中的房號。這時,初級單元有15個,每個初級單元擁有二級單元12個。首先將單元從1到15編號,在15單元中隨機(jī)抽取5個單元,分別是1,6,9,12,13號;然后在被抽中的單元中,進(jìn)行第二次抽樣,即分別在12戶居民戶中隨機(jī)抽取4戶。一、符號說明初級單元和初級單元擁有的二級單元個數(shù):N,M第一階段和第二階段抽樣的樣本量:n ,m 第i個初級單元中的第j個二級單元的觀測值:樣本中第i個初級單元中的第j個二級單元的觀測值:返回第一階段和第二階段的抽樣比:第i個初
8、級 單 元 按二級單元的平均 值:按二級單元的平均值:初級單元間的方差:返回初級單元內(nèi)的方差:由 的表達(dá)式可知,若記則有即 是 的平均值。同理有返回二、估計(jì)量及其性質(zhì)(一)總體均值的估計(jì)性質(zhì)2 對于初級單元大小相等的二階抽樣,如果兩個階段都是簡單隨機(jī)抽樣,且對每個初級單元,第二階抽樣是相互獨(dú)立進(jìn)行的,則對總體均值 的無偏估計(jì)為:其方差為:的無偏估計(jì)為:返回【例8.1】欲調(diào)查4月份100家企業(yè)的某項(xiàng)指標(biāo),首先從100家企業(yè)中抽取了一個有板有5家樣本企業(yè)的簡單隨機(jī)樣本,調(diào)查人員對5家企業(yè)分別在調(diào)查月內(nèi)隨機(jī)抽取3天作為調(diào)查日,要求樣本企業(yè)只填寫這3天的流水帳。調(diào)查的結(jié)果如下。樣 本 企 業(yè)第一日第二
9、日第三日12345573851486259416053556450634954要求根據(jù)這些數(shù)據(jù)推算不100家企業(yè)該指標(biāo)的總量,并給出估計(jì)的95%置信區(qū)間。返回解 將企業(yè)作為初級單元,將每一天看著二級單元。調(diào)查月內(nèi)擁有30天(即擁有30個二級單元)。首先在初級單元中抽取一個n=5的簡單隨機(jī)樣本再對每個樣本的二級單元分別獨(dú)立抽取一個m=3的簡單隨機(jī)樣本由題意,N=100,M=30,n=5,m=3首先計(jì)算樣本初級單元的均值 、方差 :返回樣 本 企 業(yè)123456043585057133939719于是得到:返回 置信度為置信度為95%95%的置信區(qū)間為:的置信區(qū)間為:1608001.9692161
10、608001.969216在上面的方差估計(jì)式中,第一項(xiàng)是主要的,第二項(xiàng)在上面的方差估計(jì)式中,第一項(xiàng)是主要的,第二項(xiàng)要小得多要小得多!返回(二)對總體比例的估計(jì) 如果要估計(jì)總體中具有所研究特征的二級單元數(shù)占全體全體二級單元數(shù)的比例,則式中,為第i個初級單元中具有所研究特征的二級單元數(shù),則對P的估計(jì)為:式中,為第i個初級單元中具有所研究特征的二級單元數(shù)。返回性質(zhì)3 對于二階抽樣,如果兩個階段都是簡單隨機(jī)抽樣,則有估計(jì)量 的方差為:的無偏估計(jì)為:式中,返回【例8.2】欲調(diào)查某個新小區(qū)居民家庭裝潢聘請裝潢公司的比例。我們在15個單元中隨機(jī)抽取了5個單元,在這5個單元分別隨機(jī)抽取了4戶居民進(jìn)行調(diào)查,對這
11、20戶的調(diào)查結(jié)果如下表:樣本單元第一戶第二戶第三戶第四戶一棟A座二棟C座三棟C座四棟C座五棟B座是否否否是是是否否否否否否否否否否是否否要求根據(jù)這些數(shù)據(jù)推算居民家庭裝潢聘請裝潢公司的比例。返回解:記聘請裝潢公司的居民戶為“1”,否則記為“0”。這里,N=15,M=12,n=5,m=4 ,因此,其方差的估計(jì)為:P的置信區(qū)間為:返回8.3 初級單元大小不等的二階抽樣 一般而言,初級單元的大小是不相等的,如果按初級單元的大小分層后,層內(nèi)初級單元的大小差別仍很大,則需用本節(jié)介紹的方法來處理二階抽樣的問題。當(dāng)初級單元大小不等時,一般采用不等概抽樣。一、符號說明總體中初級單元個數(shù)及第一階抽取的樣本量:N,
12、n第i個初級單元中二級單元數(shù):第i個初級單元中第二階抽樣的樣本量:第i個初級單元中第j個二級單元的觀測值:樣本中第i個初級單元中第j個二級單元的觀測值:返回第一階和第二階的抽樣比:二級單元個數(shù):指標(biāo)總和:第i個初級單元指標(biāo)總和:第i個初級單元按二級單元的平均值:返回按二級單元的平均值:初級單元間的方差:第i個初級單元二級單元間的方差:返回二、估計(jì)量及其性質(zhì)(一)對初級單元進(jìn)行簡單隨機(jī)抽樣如果二階抽樣中每個階段都采用簡單隨機(jī)抽樣,并且每個初級單元中二級單元的抽樣是相互獨(dú)立的,則對總體總和的估計(jì)可以采用簡單估計(jì),也可以考慮采用比率估計(jì)。1.簡單估計(jì)量 對總體總和的簡單估計(jì)為:根據(jù)性質(zhì)1,不僅可以證
13、明這個估計(jì)量是無偏的,并且它的方差為:返回的一個無偏估計(jì)為:式中,返回2.比率估計(jì)量 由于初級單元的大小 不同,往往造成初級單元的觀測值 差異很大,使得估計(jì)量方差 的第一項(xiàng)很大,從而估計(jì)量的方差也就變得很大。這時,可以考慮將初級單元的大小 作為輔助變量,采用比率估計(jì)量對總體總和進(jìn)行估計(jì)。對總體總和的估計(jì)量為:返回 這是一個有偏估計(jì)量,但隨著樣本量的增加,其偏倚將趨于零。其近似均方誤差為:返回的樣本估計(jì)為:式中,返回(二)對初級單元進(jìn)行放回不等概抽樣利用第五章的方法,事先規(guī)定每個初級單元被抽中的概率 對被抽中的初級單元,再抽取個二級單元。對總體總和的估計(jì)通常是構(gòu)造初級單元指標(biāo)總量的無偏估計(jì) ,然
14、后利用第五章介紹的Hansen-HuRwitz估計(jì)量對總體總量Y進(jìn)行估計(jì)。由于 是 的無偏估計(jì),由性質(zhì)1,可以證明是Y的無偏估計(jì)。且 的方差為:返回的一個無偏估計(jì)為:注意上述對第二階抽樣并沒有做出特別的規(guī)定,而且估計(jì)量的方差估計(jì)式與第二階抽樣的方式無關(guān)。在實(shí)際工作中,如果初級單元大小不相等,通常人們喜歡在第一階抽樣時按放回的與二級單元數(shù)成比例的不等概抽樣;第二階抽樣則采用簡單隨機(jī)抽樣,且每個樣本初級單元的樣本量都相等,此時,估計(jì)量的形式非常簡單。返回 【例8.3】某小區(qū)擁有10座高層建筑,每座高層建筑擁有的樓層數(shù)如下表:高層建筑ABCDEFGHIJ樓層1212161510161018 16 2
15、0 用二階抽樣方法抽出10個樓層進(jìn)行調(diào)查,第一階抽樣為放回的、按與每座建筑擁有的樓層數(shù)成比例的不等概抽樣抽取5座建筑,第二階按簡單隨機(jī)抽樣對每座建筑抽取兩層。對10個樓層居民人數(shù)的調(diào)查結(jié)果如下表:一階樣本序號12345居民數(shù)18,1215,1819,1316,1016,11返回解:已知 n=5,m=2,注意到這個樣本是自加權(quán)的,根據(jù)P181公式(8.29),得估計(jì)量的方差為:=9776.625估計(jì)量的標(biāo)準(zhǔn)差為:返回(三)對初級單元進(jìn)行不放回不等概抽樣 不放回不等概抽樣的效率比放回的效率高,因此,有時人們也會傾向于用不放回不等概抽樣來抽取初級單元。這時可利用第五章介紹的不放回不等概抽樣的結(jié)果對總
16、體總量進(jìn)行推算。當(dāng)然估計(jì)量的推算比較復(fù)雜。對總體總量Y的估計(jì)可以采用Horvitz-Thompson(赫魏茲-湯普森)估計(jì)。返回8.4 其他問題一、總樣本量及最優(yōu)樣本量的配置 對于二階抽樣,應(yīng)該抽多少二級單元,即確定n m為多少,一般可采用兩種方法:1.根據(jù)調(diào)查費(fèi)用,確定可以調(diào)查的樣本量。2.根據(jù)簡單隨機(jī)抽樣時應(yīng)抽樣本量,再乘以設(shè)計(jì) 效應(yīng)deff獲得。由于影響精度的主要原因是初級單元之間的差異,所以多抽一些初級單元,少抽一些二級單元較好。但往往初級單元的調(diào)查費(fèi)用比二級單元要高。返回考慮費(fèi)用函數(shù)為最簡單的一種形式:式中,為與樣本量無關(guān)的固定費(fèi)用,如公司的辦公費(fèi)、場租費(fèi)等;為每調(diào)查一個初級單元的費(fèi)
17、用;為每調(diào)查一個二級單元的費(fèi)用。則 m 的最優(yōu)值為:式中,實(shí)際使用時,m 應(yīng)為整數(shù),但計(jì)算出的 往往不是整數(shù),令 為的 整數(shù)部分,則m的取值規(guī)則為:返回 求出m之后,根據(jù)總費(fèi)用函數(shù),就可以確定n,從而確定最優(yōu)抽樣比 和返回二、三階及多階抽樣(一)各級單元大小相等的多階段抽樣 如果總體擁有N個初級單元,每個初級單元擁有M個二級單元,每個二級單元又擁有K個三級單元,各階的樣本量分別為 n,m,k,每個階段都按簡單隨機(jī)抽樣,則三級單元總體均值的估計(jì)為:其方差為:方差的無偏估計(jì)為:返回 由于方差的主要項(xiàng)為第一項(xiàng),其次為第二項(xiàng),第三項(xiàng)幾乎可以忽略。所以對于更高階的抽樣,估計(jì)量的方差計(jì)算一般只計(jì)算到第二階
18、至第三階就可以了。(二)各級單元大小不相等時的多階段抽樣(略)返回(三)多階抽樣的實(shí)例 某調(diào)查公司接受了一項(xiàng)關(guān)于全國城市成年居民人均奶制品消費(fèi)支出及每天至少喝一杯鮮奶人數(shù)的比例情況的調(diào)查。確定抽樣范圍為全國地級及以上城市中的成年居民。成年居民指年滿18周歲以上的居民。第一步:確定抽樣方式。調(diào)查公司決定采用多階段抽樣方法進(jìn)行方案設(shè)計(jì),調(diào)查的最小單元為成年居民。確定調(diào)查的各個階段為城市、街道、居委會、居民戶,在居民中利用而維隨機(jī)表抽取成年居民。第二步:確定樣本量及各階段樣本量的分配。按簡單隨機(jī)抽樣,在95%置信度下,絕對誤差為5%取使方差達(dá)到最大的比例P=0.5,則全國樣本量為:返回 根據(jù)以往調(diào)查
19、經(jīng)驗(yàn),估計(jì)回答率為b=80%,因此調(diào)整樣本量為:多階段抽樣的效率比簡單隨機(jī)抽樣的效率低,這里取設(shè)計(jì)效率為deff=3.2,則在全國范圍內(nèi)應(yīng)調(diào)查的樣本量為:各階段的樣本量配置為:初級單元:20個城市;二級單元:80個街道,每個樣本市內(nèi)抽4個街道;返回三級單元:160個居委會,每個樣本街道內(nèi)抽2個居委會;四級單元:1600個居民戶,每個樣本居委會內(nèi)抽10個居 民戶。在樣本居民戶內(nèi),隨機(jī)抽取一名成年 居民。第三步:確定抽樣的操作方法。第一階段 在全國城市中按與人口數(shù)成比例的放回的不等概抽樣,即PPS抽樣。第二、三階段 分別按人口數(shù)成比例的不等概等距抽樣。以第二階段為例,在某個被抽中的城市中,將其所屬
20、的街道編號,搜集各街道的人口數(shù),賦予每個街道與人口相同的代碼數(shù);根據(jù)該市總?cè)丝跀?shù)除以樣本量4,然后對代碼進(jìn)行隨機(jī)起點(diǎn)的第距抽樣,則被抽中代碼所在的街道為樣本街道。返回第四階段 分別在每個居委會中,按等距抽樣抽出10個居民戶。即根據(jù)居委會擁有的居民戶數(shù)除以樣本量10得到抽樣間距,然后隨機(jī)起點(diǎn)等距抽樣。在每個樣本居民戶,調(diào)查員按二維隨機(jī)表抽取一名成年居民。二維隨機(jī)表的使用如下:1.隨機(jī)號的確定。2.選出被訪者。返回序號姓名性別年齡1234567891011121肖明男531111111111112汪紅女522112121212213肖曉波男233211322131234肖曉玲女2141322314
21、324155412341235426631524351462771436252574388457126375319951438276528101035941728694111161510498327612127294116183105返回第四步:總體估計(jì) 記各樣本城市的80位樣本居民中,奶制品消費(fèi)總支出為 ,則各樣本城市人均奶制品消費(fèi)支出為:返回 全國1600名居民組成的樣本中,奶制品消費(fèi)總支出為 則成年居民人均奶制品消費(fèi)支出為:方差估計(jì)為:對總體比例的推算可以借用對均值的推算公式。記各樣本城市的80位樣本居民中,每天至少喝一杯鮮奶的人數(shù)為,則各樣本城市每天至少喝一杯鮮奶的人數(shù)比例為:返回全國
22、1600名居民組成的樣本中,每天至少喝一杯鮮奶的總?cè)藬?shù)為 ,則成年居民中每天至少喝一杯鮮奶的人數(shù)的比例為:p的方差的估計(jì)為:式中,返回 本章小結(jié)本章小結(jié)(1)(1)對于大規(guī)模的抽樣對于大規(guī)模的抽樣調(diào)查項(xiàng)目調(diào)查項(xiàng)目,通常采用多通常采用多階段抽樣方法階段抽樣方法;(2)(2)多階段抽樣方法多階段抽樣方法可以可以看做對樣本群內(nèi)的單元進(jìn)看做對樣本群內(nèi)的單元進(jìn)行再抽樣的一種方法行再抽樣的一種方法;(3)(3)一般來說一般來說,多階段抽樣多階段抽樣的前幾階采用的前幾階采用PPS抽樣抽樣,最最后一階采用等概率抽樣后一階采用等概率抽樣.返回本章作業(yè)本章作業(yè)(1 1)熟悉本章附錄的證明;)熟悉本章附錄的證明;(2 2)思考書后習(xí)題)思考書后習(xí)題1,1,習(xí)題習(xí)題2 2;(3 3)在作業(yè)本上完成書后)在作業(yè)本上完成書后習(xí)題習(xí)題3-3-習(xí)題習(xí)題5 5。(第八章結(jié)束)返回演講完畢,謝謝觀看!
- 溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 第10課第一課時-從“白色污染”說起-ppt課件
- 第3節(jié)神經(jīng)調(diào)節(jié)與體液調(diào)節(jié)ll的關(guān)系
- 小鞋子 中的伊朗社會
- 《桂花雨》課件2+-+副本
- 人教版數(shù)學(xué)七年級上冊余角與補(bǔ)角ppt課件
- 八年級道德與法治上冊第四單元維護(hù)國家利益第九課樹立總體國家安全觀第2框維護(hù)國家安全ppt課件新人教版
- FANUCOi系統(tǒng)數(shù)控車床操作課件
- 九年級數(shù)學(xué)上冊-26.4-解直角三角形的應(yīng)用ppt課件-(新版)冀教版
- 主語+把+名詞+動詞+趨向補(bǔ)語課件
- 七年級上冊語文-天凈沙秋思課件
- 三病母嬰阻斷項(xiàng)目新生兒早診流程及危急值管理介紹
- 計(jì)劃第5講混凝土預(yù)制樁施工
- 鼻飼技術(shù)及胃腸減壓技術(shù)課件
- 現(xiàn)代物流管理培訓(xùn)課程課件
- 《數(shù)學(xué)分析》第八章不定積分課件