統(tǒng)計數(shù)據(jù)的整理與顯示.ppt
《統(tǒng)計數(shù)據(jù)的整理與顯示.ppt》由會員分享,可在線閱讀,更多相關《統(tǒng)計數(shù)據(jù)的整理與顯示.ppt(94頁珍藏版)》請在裝配圖網上搜索。
統(tǒng)計數(shù)據(jù)的整理與顯示,第三章,2,目錄,第一節(jié)數(shù)據(jù)的預處理第二節(jié)統(tǒng)計數(shù)據(jù)的整理第三節(jié)統(tǒng)計數(shù)據(jù)的顯示,3,第一節(jié)數(shù)據(jù)的預處理,一、數(shù)據(jù)的審核二、數(shù)據(jù)的篩選三、數(shù)據(jù)的排序四、建立數(shù)據(jù)透視表,4,一、數(shù)據(jù)的審核,審核資料的完整性和及時性審核資料的正確性歷史資料的審核,數(shù)據(jù)的審核即對調查資料進行審核,5,二、數(shù)據(jù)的篩選,1)當數(shù)據(jù)中的錯誤不能予以糾正,或者有些數(shù)據(jù)不符合調查的要求而又無法彌補時,需要對數(shù)據(jù)進行篩選2)根據(jù)某種需要進行篩選,6,用Excel進行數(shù)據(jù)篩選,8名學生的考試成績數(shù)據(jù),數(shù)據(jù)篩選(datafilter),7,,數(shù)據(jù)篩選(datafilter),8,自動篩選,9,高級篩選,10,高級篩選,11,三、數(shù)據(jù)的排序,按一定順序將數(shù)據(jù)排列,以發(fā)現(xiàn)一些明顯的特征或趨勢,找到解決問題的線索排序有助于對數(shù)據(jù)檢查糾錯,以及為重新歸類或分組等提供依據(jù)在某些場合,排序本身就是分析的目的之一排序可借助于計算機完成,12,數(shù)據(jù)排序(方法),分類數(shù)據(jù)的排序字母型數(shù)據(jù),排序有升序降序之分,但習慣上用升序漢字型數(shù)據(jù),可按漢字的首位拼音字母排列,也可按筆畫排序,其中也有筆畫多少的升序降序之分,13,2.數(shù)值型數(shù)據(jù)的排序遞增排序:設一組數(shù)據(jù)為x1,x2,…,xn,遞增排序后可表示為:x(1)x(2)>…>x(n),數(shù)據(jù)排序(方法),14,在Excel中進行排序(以8名學生的考試成績?yōu)槔?數(shù)據(jù)排序(方法),15,按統(tǒng)計學成績排序后的學生成績排名,數(shù)據(jù)排序(方法),16,四、建立數(shù)據(jù)透視表,從復雜的數(shù)據(jù)中提取有用的信息可以對數(shù)據(jù)表的重要信息按使用者的習慣或分析要求進行匯總和作圖,形成交叉表數(shù)據(jù)源表中的首行必須有列標題,17,數(shù)據(jù)透視表,18,在Excel中建立數(shù)據(jù)透視表,19,形成的數(shù)據(jù)透視表,20,第二節(jié)統(tǒng)計數(shù)據(jù)的整理,一、分類型數(shù)據(jù)的整理二、順序型數(shù)據(jù)的整理三、數(shù)值型數(shù)據(jù)的整理,21,一、分類數(shù)據(jù)整理—頻數(shù)分布表,,,,,,,【例1】一家市場調查公司為研究不同品牌飲料的市場占有率,對隨機抽取的一家超市進行了調查。調查員在某天對50名顧客購買飲料的品牌和顧客性別進行了記錄。下頁表格就是記錄的原始數(shù)據(jù),用Excel制作頻數(shù)分布表,22,23,列出各類別計算各類別的頻數(shù)制作頻數(shù)分布表,分類數(shù)據(jù)的整理,,,1.基本過程,1.頻數(shù):落在各類別中的數(shù)據(jù)個數(shù)2.比例:某一類別數(shù)據(jù)占全部數(shù)據(jù)的比值3.百分比:將對比的基數(shù)作為100而計算的比值4.比率:不同類別數(shù)值的比值,,,,24,,,,,,,,,,,2.頻數(shù)分布表(通過數(shù)據(jù)透視表在Excel中得到),分類數(shù)據(jù)的整理與顯示,25,利用SPSS的頻數(shù)分析得到,26,通過SPSS的交叉列聯(lián)表獲得,27,二、順序型數(shù)據(jù)的整理,1累積頻數(shù)(cumulativefrequencies):各類別頻數(shù)的逐級累加2累積頻率(cumulativepercentages):各類別頻率(百分比)的逐級累加,方向:向上累積:自類別順序的開始一方向最后一方累加向下累積:自類別順序的最后一方向開始一方累加,28,順序數(shù)據(jù)的頻數(shù)分布表(例題分析),【例2】在一項城市住房問題的研究中,研究人員在甲乙兩個城市各抽樣調查300戶,其中的一個問題是:“您對您家庭目前的住房狀況是否滿意?1.非常不滿意;2.不滿意;3.一般;4.滿意;5.非常滿意。,24132225270300,8.044.075.090.0100.0,29,順序數(shù)據(jù)的頻數(shù)分布表(例題分析),,,30027918010238,100.093.060.034.012.7,30,【例】某生產車間50名工人日加工零件數(shù)如下(單位:個)。試對數(shù)據(jù)進行分組。,,三、數(shù)值型數(shù)據(jù)的整理,31,分組方法,分組方法,32,單變量值分組(要點),——將一個變量值作為一組1.適合于離散變量2.適合于變量值較少的情況,單變量值分組,33,單變量值分組表,34,組距分組(要點),——將變量值的一個區(qū)間作為一組適合于連續(xù)變量適合于變量值較多的離散型變量情況需要遵循“不重不漏”的原則可采用等距分組,也可采用不等距分組,組距分組,35,等距分組(步驟),1.確定組數(shù)1)一般組數(shù)K:5≤K≤152)參考Sturges(斯特杰斯)公式來確定組數(shù)K,1.確定組數(shù)2.確定組距3.繪制頻數(shù)分布表,36,1.組限:各組的上限、下限值2.下限:一個組的最小值3.上限:一個組的最大值4.閉口組:上限和下限都齊全的組5.開口組:上限或下限有一個沒有的組,等距分組(概念),37,等距分組(步驟),2.確定組距組距=上限—下限(分組已確定)組距=(最大值-最小值)組數(shù)(原始數(shù)據(jù)),3.統(tǒng)計出各組的頻數(shù)并整理成頻數(shù)分布表,38,某生產車間50名工人日加工零件數(shù)如下(單位:個)。試對數(shù)據(jù)進行分組。,數(shù)值型數(shù)據(jù)的分組,39,頻數(shù)分布表,上限不在組內,(1)上下組限重疊,40,(2)上下組限間斷,頻數(shù)分布表,41,常用的確定方法:1、按連續(xù)變量分組,由于相鄰兩組的上限和下限是同一數(shù)值,界限會重疊,為避免計算各組次數(shù)出現(xiàn)混亂,其原則是“上限不在內”2、按離散變量分組,則相鄰的上、下限通常以兩個確定的不同整數(shù)值來表示,故相鄰兩組的上、下限可以不重合。,組限的確定,42,(3)開口組,頻數(shù)分布表,43,組中值:下限與上限之間的中點值。,組中值(classmidpoint),開口組,44,在Excel中通過FREQUENCY函數(shù)得到頻數(shù)分布表,45,在SPSS中得到的頻數(shù)分布表,46,第三節(jié)統(tǒng)計數(shù)據(jù)的顯示,一、統(tǒng)計圖二、統(tǒng)計表,47,一、統(tǒng)計圖,分類型數(shù)據(jù)的統(tǒng)計圖順序型數(shù)據(jù)的統(tǒng)計圖數(shù)值型數(shù)據(jù)的統(tǒng)計圖,48,分類型數(shù)據(jù)的統(tǒng)計圖,條形圖餅圖,49,分類數(shù)據(jù)的圖示—條形圖,用寬度相同的條形高度或長短來表示各類別數(shù)據(jù)的圖形;有單式條形圖、復式條形圖等形式;主要用于反映分類數(shù)據(jù)的頻數(shù)分布;繪制時,各類別可以放在縱軸,稱為條形圖,也可以放在橫軸,稱為柱形圖。,50,在Excel中得到的條形圖,51,在SPSS中得到的條形圖(例題分析),52,在SPSS中得到的復式條形圖,53,分類數(shù)據(jù)的圖示—餅圖,也稱圓形圖,用扇形面積來表示數(shù)值大小的圖形;表示總體或樣本中各組成部分所占的比例,對于研究結構性問題十分有用;各部分所占的百分比用各個扇形面積表示,54,,,在Excel中得到的餅圖,55,在SPSS中得到的餅圖,56,順序型數(shù)據(jù)的統(tǒng)計圖,累積頻數(shù)分布圖環(huán)形圖,57,順序數(shù)據(jù)的頻數(shù)分布表(例題分析),【例2】在一項城市住房問題的研究中,研究人員在甲乙兩個城市各抽樣調查300戶,其中的一個問題是:“您對您家庭目前的住房狀況是否滿意?1.非常不滿意;2.不滿意;3.一般;4.滿意;5.非常滿意。,24132225270300,8.044.075.090.0100.0,58,順序數(shù)據(jù)的頻數(shù)分布表(例題分析),,,30027918010238,100.093.060.034.012.7,59,,,順序數(shù)據(jù)的圖示—累計頻數(shù)分布圖,圖甲城市家庭對住房狀況評價的累積頻數(shù)分布圖,(1)累積頻數(shù)分布圖,60,環(huán)形圖(在Excel中獲得),甲乙兩城市家庭對住房狀況的評價,61,餅圖﹠環(huán)形圖,相同:都可用來研究結構性問題,即均表現(xiàn)部分與整體的關系,62,數(shù)值型數(shù)據(jù)的統(tǒng)計圖,直方圖莖葉圖箱線圖線圖散點圖,63,分組數(shù)據(jù)—直方圖,用矩形的面積來表示各組的頻數(shù)分布;橫軸→數(shù)據(jù)分組縱軸→頻數(shù)或頻率,各組與相應的頻數(shù)就形成了一個矩形,即直方圖;3.直方圖的總面積等于1。,64,分組數(shù)據(jù)的圖示,,直方圖的面積之和等于1,某電腦公司銷售量分布的直方圖,,65,直方圖﹠條形圖,66,由“莖”和“葉”兩部分組成,反應原始數(shù)據(jù)分布的圖形。對于一個數(shù)字,以其最后一位數(shù)字做樹葉,其余高位數(shù)字做樹莖。例:152莖→15葉→2,未分組數(shù)據(jù)—莖葉圖,67,未分組數(shù)據(jù)—莖葉圖(例題分析),68,未分組數(shù)據(jù)—莖葉圖(擴展的莖葉圖),69,對于n(20≤n≤300)個數(shù)據(jù),莖葉圖最大行數(shù)不超過L=[10lg(n)],未分組數(shù)據(jù)—莖葉圖,70,未分組數(shù)據(jù)—莖葉圖,莖葉圖類似于橫置的直方圖,但又有區(qū)別:,71,未分組數(shù)據(jù)—箱線圖,由一個箱子和兩條線段組成。5個特征值:最大值、最小值、中位數(shù)Me和兩個四分位數(shù)(下四分位數(shù)QL和上四分位數(shù)QU)連接兩個四分位數(shù)畫出箱子,再將兩個極值點與箱子相連接,72,未分組數(shù)據(jù)—單批數(shù)據(jù)箱線圖(箱線圖的構成),73,未分組數(shù)據(jù)—單批數(shù)據(jù)箱線圖,74,,未分組數(shù)據(jù)—多批數(shù)據(jù)箱線圖,【例】從某大學學生中隨機抽取11人,對8門課程的考試成績進行調查,結果如表。試繪制各科考試成績的比較箱線圖,并分析其分布特征,75,未分組數(shù)據(jù)—多批數(shù)據(jù)箱線圖(SPSS得到),8門課程成績箱線圖,76,11名學生8門課程考試成績的箱線圖,,,,,Min-Max,,25%-75%,,Medianvalue,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,45,55,65,75,85,95,105,,,,,,,,,,,,,,,學生1,學生2,學生3,學生4,學生5,學生6,學生7,學生8,學生9,學生10,學生11,未分組數(shù)據(jù)—多批數(shù)據(jù)箱線圖,77,時間序列數(shù)據(jù)—線圖(lineplot),繪制線圖時應注意以下幾點時間一般繪在橫軸,指標數(shù)據(jù)繪在縱軸;圖形的長寬比例要適當,其長寬比例大致為10:7一般情況下,縱軸數(shù)據(jù)下端應從“0”開始,以便于比較。數(shù)據(jù)與“0”之間的間距過大時,可以采取折斷的符號將縱軸折斷。,78,時間序列數(shù)據(jù)—線圖(例題分析),【例】已知1991~2000年我國城鄉(xiāng)居民家庭的人均收入數(shù)據(jù)如右表。試繪制線圖。,79,時間序列數(shù)據(jù)—線圖(Excel得到),80,SPSS中得到的線圖,81,散點圖,用二維坐標展示兩個變量之間關系使用的數(shù)據(jù)是成對的數(shù)據(jù),如(xi,yi)以變量x為橫軸,變量y為縱軸,在坐標系中描出各數(shù)據(jù)點,82,【例】小麥的單位面積產量與降雨量和溫度等有一定關系。收集到如下數(shù)據(jù)。試據(jù)此繪制散點圖。,多變量數(shù)據(jù)—散點圖,83,多變量數(shù)據(jù)—散點圖(Excel獲得),84,SPSS中獲得散點圖,85,二、統(tǒng)計表,統(tǒng)計表的概念和結構統(tǒng)計表的種類編制統(tǒng)計表應注意的問題,86,統(tǒng)計表的結構,橫行標題,縱覽標題,數(shù)字資料,,,,,總標題,附加,,,主詞,,,賓詞,,87,簡單表:表的主詞未經任何分組的統(tǒng)計表。其主詞一般按時間順序,或按總體各單位名稱排列,通常是對調查來的原始資料初步整理所采取的形式。2.分組表:表的主詞按某一標志進行分組的統(tǒng)計表。用于揭示不同類型現(xiàn)象的特征,說明現(xiàn)象內部的結構,分析現(xiàn)象之間的相互關系等。3.復合表:表的主詞按照兩個或兩個以上標志進行復合分組的統(tǒng)計表。能更深刻詳細地反映客觀,但并非分組越細越好。,統(tǒng)計表的種類,88,1998年某公司所屬兩企業(yè)合格品數(shù)量表,統(tǒng)計表類型-簡單表,89,1998年某地區(qū)工業(yè)凈產值和職工人數(shù),統(tǒng)計表類型-分組表,90,統(tǒng)計表類型-復合表,91,標題應簡明地概括所要反映的內容。表中主詞各行和賓詞各欄,一般應按先局部后整體的原則排列。統(tǒng)計表的欄數(shù)如果過多,要加以編號,主詞和計量單位各欄用(甲)、(乙)、(丙)等文字編寫;賓詞指標各欄則用(1)、(2)、(3)等數(shù)字編號。,編制統(tǒng)計表應注意的問題,92,編制統(tǒng)計表應注意的問題,4.表中數(shù)字要填寫整齊,位數(shù)對準。當不存在某項數(shù)字時,用符號“—”表示;當缺乏某項數(shù)字時,用符號“…”表示。5.數(shù)字資料要注明計量單位。6.某些特殊資料需要說明的,應在表的下方加以注解;數(shù)字資料要在表下說明來源,以備查考。7.統(tǒng)計表編制完畢審核后,制表人和主管部門負責人要簽字,并加蓋公章以示負責。,93,第三章小結,1、預處理:審核、篩選、排序、數(shù)據(jù)透視表2、整理:分類數(shù)據(jù)——頻數(shù)分布表順序數(shù)據(jù)——累積頻數(shù)分布表(向上/向下)數(shù)值型數(shù)據(jù)——組距分組(3步),94,3、顯示:分類數(shù)據(jù)——條形圖、餅圖順序數(shù)據(jù)——累積頻數(shù)分布圖、環(huán)形圖數(shù)值型數(shù)據(jù)——直方圖、莖葉圖、箱線圖、線圖、散點圖4、對比:餅圖→環(huán)形圖;條形圖→直方圖;直方圖→莖葉圖,第三章小結,- 配套講稿:
如PPT文件的首頁顯示word圖標,表示該PPT已包含配套word講稿。雙擊word圖標可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設計者僅對作品中獨創(chuàng)性部分享有著作權。
- 關 鍵 詞:
- 統(tǒng)計數(shù)據(jù) 整理 顯示
裝配圖網所有資源均是用戶自行上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作他用。
相關資源
更多
正為您匹配相似的精品文檔
相關搜索
鏈接地址:http://m.jqnhouse.com/p-3526044.html