Pearson相關(guān)系數(shù)簡介.ppt
《Pearson相關(guān)系數(shù)簡介.ppt》由會(huì)員分享,可在線閱讀,更多相關(guān)《Pearson相關(guān)系數(shù)簡介.ppt(26頁珍藏版)》請?jiān)谘b配圖網(wǎng)上搜索。
兩變量關(guān)聯(lián)性分析 pearson相關(guān)系數(shù)介紹,世間萬物是普遍聯(lián)系的,醫(yī)學(xué)上,許多現(xiàn)象之間也都有相互聯(lián)系,例如:身高與體重、體溫與脈搏、年齡與血壓、產(chǎn)前檢查與嬰兒體重、乙肝病毒與乙肝等。在這些有關(guān)系的現(xiàn)象中,它們之間聯(lián)系的程度和性質(zhì)也各不相同。,相關(guān)的含義,圖5-0(a) 函數(shù)關(guān)系,客觀現(xiàn)象之間的數(shù)量聯(lián)系存在著函數(shù)關(guān)系和相關(guān)關(guān)系。 當(dāng)一個(gè)或幾個(gè)變量取定值時(shí),另一個(gè)變量有確定的值與之對應(yīng),稱為函數(shù)關(guān)系,可用Y=f(X)表示。,當(dāng)一個(gè)變量增大,另一個(gè)也隨之增大(或減少),我們稱這種現(xiàn)象為共變,或相關(guān)(correlation)。兩個(gè)變量有共變現(xiàn)象,稱為有相關(guān)關(guān)系。 相關(guān)關(guān)系不一定是因果關(guān)系。 主要探討線性相關(guān)——pearson相關(guān)系數(shù),主要內(nèi)容,一、散點(diǎn)圖 二、相關(guān)系數(shù) 三、相關(guān)系數(shù)的假設(shè)檢驗(yàn),一、散點(diǎn)圖,為了確定相關(guān)變量之間的關(guān)系,首先應(yīng)該收集一些數(shù)據(jù),這些數(shù)據(jù)應(yīng)該是成對的。 例如,每人的身高和體重。然后在直角坐標(biāo)系上描述這些點(diǎn),這一組點(diǎn)集稱為散點(diǎn)圖。,作法:為了研究父親與成年兒子身高之間的關(guān)系,卡爾.皮爾遜測量了1078對父子的身高。把1078對數(shù)字表示在坐標(biāo)上,如圖。用水平軸X上的數(shù)代表父親身高,垂直軸Y上的數(shù)代表兒子的身高,1078個(gè)點(diǎn)所形成的圖形是一個(gè)散點(diǎn)圖。,它的形狀象一塊橄欖狀的云,中間的點(diǎn)密集,邊沿的點(diǎn)稀少,其主要部分是一個(gè)橢圓。,2.相關(guān)類型:,3.作用:粗略地給出了兩個(gè)變量的關(guān)聯(lián)類型與程度,通過相關(guān)散布圖的形狀,我們大概可以判斷變量之間相關(guān)程度的強(qiáng)弱、方向和性質(zhì),但并不能得知其相關(guān)的確切程度。,為精確了解變量間的相關(guān)程度,還需作進(jìn)一步統(tǒng)計(jì)分析,求出描述變量間相關(guān)程度與變化方向的量數(shù),即相關(guān)系數(shù)??傮w相關(guān)系數(shù)用p表示,樣本相關(guān)系數(shù)用r表示。,二、相關(guān)系數(shù),變量的取值區(qū)間越大,觀測值個(gè)數(shù)越多,相關(guān)系數(shù)受抽樣誤差的影響越小,結(jié)果就越可靠,如果數(shù)據(jù)較少,本不相關(guān)的兩列變量,計(jì)算的結(jié)果可能相關(guān)。 相關(guān)系數(shù)取值: -1r1,相關(guān)系數(shù)的性質(zhì),|r|表明兩變量間相關(guān)的程度,r0表示正相關(guān),r0表示負(fù)相關(guān),r=0表示零相關(guān)。,相關(guān)系數(shù)的性質(zhì),|r|越接近于1,表明兩變量相關(guān)程度越高,它們之間的關(guān)系越密切。,|r|的取值與相關(guān)程度,Pearson相關(guān)系數(shù)的計(jì)算,,,,,適用條件 1、兩變量均應(yīng)由測量得到的連續(xù)變量。 2、兩變量所來自的總體都應(yīng)是正態(tài)分布,或接近正態(tài)的單峰對稱分布。 3、變量必須是成對的數(shù)據(jù)。 4、兩變量間為線性關(guān)系。,Pearson相關(guān)系數(shù)的計(jì)算,,,,,X 的離均差平方和: Y 的離均差平方和: X與Y 間的離均差積和:,離均差平方和、離均差積和的展開,例13-1,測得某地15名正常成年人的血鉛X和24小時(shí)的尿鉛Y,試分析血鉛與24小時(shí)尿鉛之間是否直線相關(guān)。,15名自愿者的血鉛和24小時(shí)尿鉛測量值(μmol/L),,∑X=3.00 ∑Y=3.17 ∑ X2=0.7168 ∑Y2=0.7681 ∑XY=0.7388 n=15 =0.9787,相關(guān)系數(shù)的假設(shè)檢驗(yàn),意義: 上例中的相關(guān)系數(shù)r等于0.9787,說明了15例樣本中血鉛與尿鉛之間存在相關(guān)關(guān)系。 但是,這15例只是總體中的一個(gè)樣本,由此得到的相關(guān)系數(shù)會(huì)存在抽樣誤差。因?yàn)椋傮w相關(guān)系數(shù)(?)為零時(shí),由于抽樣誤差,從總體抽出的15例,其r可能不等于零。 所以,要判斷該樣本的r是否有意義,需與總體相關(guān)系數(shù)?=0進(jìn)行比較,看兩者的差別有無統(tǒng)計(jì)學(xué)意義。這就要對r進(jìn)行假設(shè)檢驗(yàn),判斷r不等于零是由于抽樣誤差所致,還是兩個(gè)變量之間確實(shí)存在相關(guān)關(guān)系。,相關(guān)系數(shù)的假設(shè)檢驗(yàn),步驟 1.提出假設(shè) H0 : p=0 無關(guān) H1 : p≠0 相關(guān) 2.確定顯著性水平 ?=0.05 如果從相關(guān)系數(shù)ρ=0的總體中取得某r值的概率P0.05,我們就接受假設(shè),認(rèn)為此r值的很可能是從此總體中取得的。因此判斷兩變量間無顯著關(guān)系; 如果取得r值的概率P≤0.05或P≤0.01,我們就在α=0.05或α=0.01水準(zhǔn)上拒絕檢驗(yàn)假設(shè),認(rèn)為該r值不是來自ρ=0的總體,而是來自ρ≠0的另一個(gè)總體,因此就判斷兩變量間有顯著關(guān)系。 3.計(jì)算檢驗(yàn)統(tǒng)計(jì)量,查表得到P值。拒絕H0,則兩變量相關(guān)。否則,兩變量無關(guān)。,相關(guān)系數(shù)的假設(shè)檢驗(yàn),t檢驗(yàn)法 計(jì)算檢驗(yàn)統(tǒng)計(jì)量tr,查t界值表,得到P值,例題,H0 : ?=0 無關(guān) H1 : ?≠0 相關(guān) ?=0.05 r=0.9787, n=15, 代入公式 v=15-2=13,查界值表,P0.001,拒絕H0,認(rèn)為血鉛與尿鉛之間有正相關(guān)關(guān)系。,三、相關(guān)注意事項(xiàng),線性相關(guān)的前提條件是X、Y都服從正態(tài)分布(雙變量正態(tài)分布) 當(dāng)散點(diǎn)圖有線性趨勢時(shí),才可進(jìn)行線性相關(guān)分析 必須在假設(shè)檢驗(yàn)認(rèn)為相關(guān)的前提下才能以r的大小判斷相關(guān)程度 相關(guān)關(guān)系并不一定是因果關(guān)系,有可能是伴隨關(guān)系,*如何判斷兩個(gè)變量的相關(guān)性 (1)找出兩個(gè)變量的正確相應(yīng)數(shù)據(jù)。 (2)畫出它們的散布圖(散點(diǎn)圖)。 (3)通過散布圖判斷它們的相關(guān)性。 (4)給出相關(guān)(r)的解答。 (5)對結(jié)果進(jìn)行評價(jià)和檢驗(yàn)。,Thank you,- 1.請仔細(xì)閱讀文檔,確保文檔完整性,對于不預(yù)覽、不比對內(nèi)容而直接下載帶來的問題本站不予受理。
- 2.下載的文檔,不會(huì)出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請點(diǎn)此認(rèn)領(lǐng)!既往收益都?xì)w您。
下載文檔到電腦,查找使用更方便
9.9 積分
下載 |
- 配套講稿:
如PPT文件的首頁顯示word圖標(biāo),表示該P(yáng)PT已包含配套word講稿。雙擊word圖標(biāo)可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計(jì)者僅對作品中獨(dú)創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- Pearson 相關(guān)系數(shù) 簡介
鏈接地址:http://m.jqnhouse.com/p-1840703.html