MINITAB培訓-假設(shè)檢驗-方差-回歸-DOE-MSA.ppt
《MINITAB培訓-假設(shè)檢驗-方差-回歸-DOE-MSA.ppt》由會員分享,可在線閱讀,更多相關(guān)《MINITAB培訓-假設(shè)檢驗-方差-回歸-DOE-MSA.ppt(147頁珍藏版)》請在裝配圖網(wǎng)上搜索。
,,,,,一、假設(shè)檢驗,*************編,SIX SIGMA 培訓,二、方差分析,三、質(zhì)量工具,四、試驗設(shè)計,,假設(shè)檢驗,假設(shè)檢驗的理解(Hypothesis Test),,對總體參數(shù)分布做假設(shè),根據(jù)樣本(Sample)觀測值運用統(tǒng)計技術(shù)分析方法檢驗這種 假設(shè)是否正確,從而選擇接受或拒絕假設(shè)的過程。,,,,,假設(shè) : 特定某總體是 , , , ex) 制造部男員工的平均 身高是172 cm.,原假設(shè)(Ho, Null Hypothesis) : 肯定 對立假設(shè)(H1 or Ha, Alternative Hypothesis) : 否定原假設(shè),某總體(N),Sample,,根據(jù)Sample的數(shù)據(jù) 檢驗已設(shè)定的該總體的假設(shè)檢驗 → 原假設(shè)(Ho)設(shè)定 : 制造部男員工身高是172cm → 設(shè)定對立假設(shè)(H1 or Ha) : 不是172cm(或),,11 -1/22,,假設(shè)檢驗,假設(shè)檢驗的類別,,11 -2/22,,假設(shè)檢驗 Process,Graph 分析,Histogram, Box Plot, 散點圖等,致命因子選定,改善對象的明確化,,假設(shè)檢驗,,,Z Test, T Test, F test, ANOVA 等,,Graph 分析,,,Subgroup≥2,相關(guān)/回歸 分析,正規(guī)性檢證(Y),Chi-square Test,連續(xù)型 ?,1 Sample T-Test,分散同質(zhì)性檢證(X),Subgroup =2,ANOVA,2 Sample T,Critical X 選定,,Yes,No,,No,Yes,No,Yes,,,,分析(A),相關(guān)分析,Yes,No,,,11 -3/22,,假設(shè)檢驗 Process,. 假設(shè)檢驗的步驟 a 建立對立假設(shè)和原假設(shè) b 選擇顯著性水平(一般為5%) c 選擇檢驗方法 d 計算關(guān)于樣本的Data的P值. e 比較P值和顯著性水平導出結(jié)論 . P-Value - 在原假設(shè)設(shè)定為對的假設(shè)下,所觀測事件的概率 顯著水平為5%的情況下: P0.05時,接受原假設(shè),拒絕對立假設(shè); P0.05時,接受對立假設(shè),拒絕原假設(shè);,,11 -4/22,,Theme選定,活動范圍 選定,CTQ 明確化,對CTQ的 Gage R&R,工程能力 分析,,,,Define,Measure,假設(shè)檢驗 Process,什么時候使用假設(shè)檢驗?,Graph 解釋 假設(shè)檢驗,實驗計劃 (DOE),檢驗實驗,管理計劃,,Analysis,,Improve,,Control,對影響Y變動的潛在性的候補因子,各個實施假設(shè)檢驗 為了確認是否影響Y的因子而使用。 變更某Process以后,為了檢驗變更前后統(tǒng)計性的改變了沒有而使用。,,11 -5/22,,假設(shè)檢驗事例,1 Sample Z Test,1-Sample Z應(yīng)用實例:,,加工一批零件,外園直徑的目標值為5.5mm,過去標準差為0.016,從加工的零件中抽取35個,測得直 徑如下:,11 -6/22,問該批零件外園直徑均值是否偏離目標值?,,假設(shè)檢驗事例,1 Sample Z Test,1-Sample Z應(yīng)用實例:,,1、建立假設(shè): H0:該批零件外園直徑均值μ=5.50; H1:該批零件外園直徑均值μ≠5.50; 2、確定信賴度為95%;則α=0.05; 3、選擇假設(shè)檢驗方法1 Sample Z; 應(yīng)用MINITABL計算P=0.579; StatBasic Statistics1-Sample Z, 4、比較P0.05的大小,判定:接受H0,,11 -7/22,,,,出現(xiàn)對話框后: Variables欄中選外園直徑數(shù)值; SIGMA:欄中填0.016(總體σ) TEST MEAN欄中填5.50(目標均值) GRAPHS對話框可填可不填 OPTIONS 對話框: CONFIDENCE LEVEL:95.0(置信度水平) ALTERNATIVE: not equal(對立假設(shè)),One-Sample Z: sample實施結(jié)果: Test of mu = 5.5 vs mu not = 5.5 The assumed sigma = 0.016 Variable N Mean StDev SE Mean sample 35 5.50143 0.02390 0.00270 Variable 95.0% CI Z P sample ( 5.49613, 5.50673) 0.53 0.597,,,假設(shè)檢驗事例,1 Sample T Test,1 Sample T Test實例:,,Height 66.00 72.00 73.50 73.00 69.00 73.00 72.00 74.00 72.00 71.00 74.00 72.00 70.00 67.00 71.00 72.00 69.00 73.00 74.00 66.00,● 確認Height的平均個子是否70.(單,不知道母體的標準偏差.) - 原假設(shè) : 平均個子 = 70 -對立假設(shè) : 平均個子≠ 70,,Test of mu = 70 vs mu not = 70 Variable N Mean StDev SE Mean Height 20 71.175 2.561 0.573 Variable 95.0% CI T P Height (69.976, 72.374) 2.05 0.054,,,◎平均:71.175 ◎標準偏差:2.561 ◎平均的標準偏差:0.573 ◎母平均的95% 置信區(qū)間 :69.976 ~72.374 ◎p-value:0.054 ?p-value比0.05大,接受0假設(shè).即,可以平均個子看作70 70包含在置信區(qū)間里面。,Minitab Menu : Stat / Basic Statistics/ 1 Sample T Test,* 注意 : 在Option 上各 greater than, less than, not equal的含義是什么 ?,,11 -8/22,,,,目標均值,,假設(shè)檢驗事例,2 Sample T Test,2 Sample T Test實例:,,例3:A、B兩種不同情況下測得某PCB焊點拉拔力數(shù)據(jù)如下: A:5.65 5.89 4.37 4.28 5.12 ; B:5.99 5.78 5.26 4.99 4.88;問兩種條件下PCB的焊點拉拔力是否有顯著區(qū)別? H0:A=B;H1:A≠B Minitab Menu : Stat / Basic Statistics/ 2 Sample T Test,11 -9/22,,,,數(shù)據(jù),標注,,數(shù)據(jù),,假設(shè)檢驗事例,2 Sample T Test,實施結(jié)果:,,P值比0.05大,接受H0;即2種條件下的PCB板焊點拔取力沒有差異 從平均值看B比A 拔取力大 總體均值的置信區(qū)間:(--1.278,0.642),Two-sample T for A vs B N Mean StDev SE Mean A 5 5.062 0.729 0.33 B 5 5.380 0.487 0.22 Difference = mu A - mu B Estimate for difference: -0.318 95% CI for difference: (-1.278, 0.642) T-Test of difference = 0 (vs not =): T-Value = -0.81 P-Value = 0.448 DF = 6,11 -10/22,,,假設(shè)檢驗事例,成對數(shù)據(jù)的假設(shè)檢驗,,●英語分數(shù)向上程序運營后,比較程序?qū)嵤┣昂蛯嵤┖蟮挠⒄Z分數(shù),檢討向上程序是否實際上很有用 程序?qū)嵤┣?后的分數(shù)入以下時,檢討程序是否有利于英語分數(shù)向上.(各 10個隨意抽出),Before after 76 81 60 52 85 87 58 70 91 86 75 77 82 90 64 63 79 85 88 83,,Paired T-Test and CI: before, after Paired T for before - after N Mean StDev SE Mean before 10 75.80 11.64 3.68 after 10 77.40 12.18 3.85 Difference 10 -1.60 6.38 2.02 95% CI for mean difference: (-6.16, 2.96) T-Test of mean difference=0(vs not=0):T-Value=-0.79 P-Value=0.448,,,Minitab Menu : Stat / Basic Statistics/ Paired T,Paired T : CI Mean Difference 2 Sample T : CI Difference,Paired T,11 -11/22,,假設(shè)檢驗事例,1-Proportion,,◆ DID 事業(yè)部為了確認A 廠家的6sigma的PJT成果,調(diào)查了300個sample,出現(xiàn)了15個不良品. A 廠家交貨部品的目標不良率為15% ,能不能看做目標達成了 ?,Minitab Menu : stat /Basic Statistics/1-Proportion,,,Click,Test of p = 0.15 vs p not = 0.15 Sample X N Sample p 95.0% CI P-Value 1 15 300 0.050 (0.028251,0.081127) 0.000,,,▼ 實行結(jié)果,11 -12/22,,假設(shè)檢驗事例,,2-Proportion,◆ DID事業(yè)部為了比較 A,B兩個line上發(fā)生的不良率,收集了Data.其結(jié)果A Line上1000個當中有75個不良, B Line 上1500個當中發(fā)現(xiàn)了120個不良。能不能看作Line間不良率有差異?,Minitab Menu : stat /Basic Statistics/2-Proportion,,Test and CI for Two Proportions Sample X N Sample p 1 75 1000 0.075000 2 120 1500 0.080000 Estimate for p(1) - p(2): -0.005 95% CI for p(1) - p(2): (-0.0263305, 0.0163305) Test for p(1)-p(2)=0(vs not=0): Z=-0.46 P-Value=0.646,,,◎P-value : 0.646(64.6%) ?P-value值大,因此可以說0假設(shè)是對的。 即,可以說A ,B兩個line上所發(fā)生的不良率 沒有差異。,11 -13/22,,,,假設(shè)檢驗事例,,◆ 需同時檢驗多個樣本均值有無差異時,需要用到方差分析,建立假設(shè): H0:膠水A粘接力均值=膠水B粘接力均值=膠水C的粘接力均值 H1:膠水A粘接力均值≠膠水B粘接力均值≠膠水C的粘接力均值 確定顯著水平:α=0.05 選擇假設(shè)檢驗類別:單變量方差分析 Minitab 計算P值。,11 -14/22,例:想了解三種不同膠水對元件粘接力的影響,分別測得不同膠水粘接力如下:,問三種膠水粘接力均值有無差異?,,假設(shè)檢驗事例,,,11 -15/22,Stat ANOVA One-way(Unstacked),,,注:Unstacked 指不同條件的數(shù)據(jù)存儲在不同列的狀態(tài),實施結(jié)果:One-way ANOVA: A, B, C Analysis of Variance Source DF SS MS F P Factor 2 0.145 0.073 0.26 0.778 Error 15 4.273 0.285 Total 17 4.419 Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev --------+---------+---------+-------- A 6 5.6767 0.5823 (------------*------------) B 6 5.5433 0.5558 (------------*-------------) C 6 5.4583 0.4547 (------------*------------) --------+---------+---------+-------- Pooled StDev = 0.5338 5.25 5.60 5.95,,假設(shè)檢驗事例,,2-Proportion,11 -16/22,,,P》0.05,因此接受零假設(shè)H0,,A、B、C膠水粘接力均值數(shù)據(jù)置信區(qū)間有重合部分,,假設(shè)檢驗事例,,2VARIANCES,11 -17/22,對兩個總體的分布狀況進行比較,如對兩個車床所加工出來的零件尺寸精度的比較,這時會用到F檢驗。,例:兩臺車床加工一批零件,為了解兩臺車床加工精度方面有無差異,各抽取10個零件測得尺寸A數(shù)值如下:車床1:25.3,25.2,25.2,25.5,25.52,25.51,25.54,25.55,25.5,25.52; 車床2: 25.5,25.55,25.56,25.49,25.48,25.53,25.52,25.54,25.5,25.47; 問:兩臺車床加工精度有無差異?,步驟: H0:車床1加工的工件尺寸A的標準差=車床2加工的工件尺寸A的標準差 H1:車床1加工的工件尺寸A的標準差≠車床2加工的工件尺寸A的標準差 確定α=0.05 選擇假設(shè)檢驗類別F檢驗法; 例用MINITAB 計算P Minitab StatBasic Statistics2 Variances,,假設(shè)檢驗事例,,2-Proportion,11 -18/22,,假設(shè)檢驗事例,,2-Proportion,,11 -19/22,Test for Equal Variances Level1 CHE1 Level2 CHE2 ConfLvl 95.0000 Bonferroni confidence intervals for standard deviations Lower Sigma Upper N Factor Levels 4.66E-02 7.13E-02 0.143584 10 CHE1 2.00E-02 3.06E-02 0.061664 10 CHE2 F-Test (normal distribution) Test Statistic: 5.422 P-Value : 0.019 Levene's Test (any continuous distribution) Test Statistic: 0.077 P-Value : 0.785,,接受零假設(shè),兩臺車床加工精度沒有差異,,假設(shè)檢驗事例,,2-Proportion,11 -20/22,在需要同時比較多個方差的場合,需進行多樣本方差檢驗,四臺設(shè)備同時加工一種工件,為了解4臺設(shè)備的精度有無差異,每臺設(shè)備抽樣10PCS測得尺寸如下(略),問四臺設(shè)備精度是否有差異?,H0:。。。。。。;H1:。。。。。。,MINTAB 工作表數(shù)據(jù):,Stat ANOVA Test for Equal Variances,,,假設(shè)檢驗事例,,2-Proportion,11 -21/22,Response SIZE Factors EQUIP ConfLvl 95.0000 Bonferroni confidence intervals for standard deviations Lower Sigma Upper N Factor Levels 1.84368 2.94581 6.5147 10 A 3.29134 5.25885 11.6301 10 B 3.13351 5.00666 11.0723 10 C 2.76454 4.41714 9.7686 10 D Bartlett's Test (normal distribution) Test Statistic: 3.055 P-Value : 0.383 Levene's Test (any continuous distribution) Test Statistic: 0.295 P-Value : 0.829,,,,,,假設(shè)檢驗事例,,2-Proportion,11 -22/22,根據(jù)上圖結(jié)果Bartlett檢驗法和Levene檢驗法得出一致結(jié)論,P值大于0.05,所以認為四臺車床加工的工件精度沒有顯著差異. 有時會存在Bartlett檢驗法和Levene檢驗法得出的結(jié)論不一致的問題,這時可檢驗數(shù)據(jù)的正態(tài)性,如為正態(tài)分布數(shù)據(jù),則以Bartlett檢驗法為結(jié)論.如為非正態(tài)分布,則以Levene檢驗法為準.,2.3 統(tǒng)計技術(shù)方法,2.3.1 方差分析 2.3.2 回歸分析 2.3.3 試驗設(shè)計,2.3.1 方差分析,一、幾個概念 二、單因子方差分析 三、重復數(shù)不等的情況,一、幾個概念,在試驗中改變狀態(tài)的因素稱為因子,常用大寫英文字母A、B、C、…等表示。 因子在試驗中所處的狀態(tài)稱為因子的水平。用代表因子的字母加下標表示,記為A1,A2,…,Ak。 試驗中所考察的指標(可以是質(zhì)量特性也可以是產(chǎn)量特性或其它)用Y表示。Y是一個隨機變量。 單因子試驗: 若試驗中所考察的因子只有一個。,[例2.1-1] 現(xiàn)有甲、乙、丙三個工廠生產(chǎn)同一種零件,為了了解不同工廠的零件的強度有無明顯的差異,現(xiàn)分別從每一個工廠隨機抽取四個零件測定其強度,數(shù)據(jù)如表所示,試問三個工廠的零件的平均強度是否相同?,三個工廠的零件強度,在這一例子中,考察一個因子: 因子A:工廠 該因子有三個水平:甲、乙、丙 試驗指標是:零件強度,這是一個單因子試驗的問題。每一水平下的試驗結(jié)果構(gòu)成一個總體,現(xiàn)在需要比較三個總體均值是否一致。如果每一個總體的分布都是正態(tài)分布,并且各個總體的方差相等,那么比較各個總體均值是否一致的問題可以用方差分析方法來解決。,二、單因子方差分析,假定因子A有r個水平,在Ai水平下指標服從正態(tài)分布,其均值為 ,方差為 ,i=1,2, …, r。每一水平下的指標全體便構(gòu)成一個總體,共有r個總體,這時比較各個總體的問題就變成比較各個總體的均值是否相同的問題了,即要檢驗如下假設(shè)是否為真:,當 不真時,表示不同水平下的指標的均值有顯著差異,此時稱因子A是顯著的,否則稱因子A不顯著。檢驗這一假設(shè)的分析方法便是方差分析。,方差分析的三個基本假定,1. 在水平 下,指標服從正態(tài)分布 ;,2. 在不同水平下,各方差相等;,3. 各數(shù)據(jù) 相互獨立。,設(shè)在一個試驗中只考察一個因子A,它有r個水平,在每一水平下進行m次重復試驗,其結(jié)果用 表示,i=1,2, …, r。 常常把數(shù)據(jù)列成如下表格形式:,單因子試驗數(shù)據(jù)表,記第i水平下的數(shù)據(jù)均值為 ,總均值為 。此時共有n=rm個數(shù)據(jù),這n個數(shù)據(jù)不全相同,它們的波動(差異)可以用總離差平方和ST去表示,記第i 水平下的數(shù)據(jù)和為Ti, ;,引起數(shù)據(jù)波動(差異)的原因不外如下兩個:,一是由于因子A的水平不同,當假設(shè)H0不真時,各個水平下指標的均值不同,這必然會使試驗結(jié)果不同,我們可以用組間離差平方和來表示,也稱因子A的離差平方和:,這里乘以m是因為每一水平下進行了m次試驗。,二是由于存在隨機誤差,即使在同一水平下獲得的數(shù)據(jù)間也有差異,這是除了因子A的水平外的一切原因引起的,我們將它們歸結(jié)為隨機誤差,可以用組內(nèi)離差平方和表示:,Se:也稱為誤差的離差平方和,可以證明有如下平方和分解式:,ST、SA、Se 的自由度分別用 、 、 表示,它們也有分解式: ,其中:,因子或誤差的離差平方和與相應(yīng)的自由度之比稱為因子或誤差的均方和,并分別記為:,兩者的比記為:,當 時認為在顯著性水平 上因子A是顯著的。其中 是自由度為 的F分布的1-α分位數(shù)。,單因子方差分析表,各個離差平方和的計算:,其中 是第i個水平下的數(shù)據(jù)和;T表示所有n=rm個數(shù)據(jù)的總和。,進行方差分析的步驟如下:,(1)計算因子A的每一水平下數(shù)據(jù)的和T1,T2,…,Tr及總和T;,(2)計算各類數(shù)據(jù)的平方和 ;,(3)依次計算ST,SA,Se;,(4)填寫方差分析表;,(5)對于給定的顯著性水平α,將求得的F值與F分布表中的臨界值 比較,當 時認為因子A是顯著的,否則認為因子A是不顯著的。,對上例的分析,(1)計算各類和:,每一水平下的數(shù)據(jù)和為:,數(shù)據(jù)的總和為T=1200,(2)計算各類平方和:,原始數(shù)據(jù)的平方和為:,每一水平下數(shù)據(jù)和的平方和為,(3)計算各離差平方和:,ST=121492-12002/12=1492, fT=3×4-1=11 SA=485216/4-12002/12=1304, fA=3-1=2 Se= 1492-1304=188, fe=11-2=9,(4)列方差分析表:,[例2.1-1]的方差分析表,(5) 如果給定 =0.05,從F分布表查得,由于F4.26,所以在 =0.05水平上結(jié)論是因子A是顯著的。這表明不同的工廠生產(chǎn)的零件強度有明顯的差異。,當因子A是顯著時,我們還可以給出每一水平下指標均值的估計,以便找出最好的水平。在單因子試驗的場合,第i個水平指標均值的估計為:,,,在本例中,三個工廠生產(chǎn)的零件的平均強度的的估計分別為:,由此可見,乙廠生產(chǎn)的零件的強度的均值最大,如果我們需要強度大的零件,那么購買乙廠的為好;而從工廠來講,甲廠與丙廠應(yīng)該設(shè)法提高零件的強度。,誤差方差的估計:這里方差 的估計是MSe。在本例中: 的估計是20.9。,的估計是,[例2.1-2] 略(見教材P92),三、重復數(shù)不等的情況,若在每一水平下重復試驗次數(shù)不同,假定在Ai水平下進行 次試驗,那么進行方差分析的步驟仍然同上,只是在計算中有兩個改動:,例2.1-3 某型號化油器原中小喉管的結(jié)構(gòu)使油耗較大,為節(jié)約能源,設(shè)想了兩種改進方案以降低油耗。油耗的多少用比油耗進行度量,現(xiàn)在對用各種結(jié)構(gòu)的中小喉管制造的化油器分別測定其比油耗,數(shù)據(jù)如表所列,試問中小喉管的結(jié)構(gòu)(記為因子A)對平均比油油耗的影響是否顯著。(這里假定每一種結(jié)構(gòu)下的油耗服從等方差的正態(tài)分布),[例2.1-3]的試驗結(jié)果,(為簡化計算,這里一切數(shù)據(jù)均減去220,不影響F比的計算及最后分析因子的顯著性),(1)各水平下的重復試驗次數(shù)及數(shù)據(jù)和分別為:,A1:m1=8,T1=69.5 A2:m2=4,T2=6.0 A3:m3=4,T3=15.4,總的試驗次數(shù)n=16,數(shù)據(jù)的總和為T=90.9,(2)計算各類平方和:,,,(3)計算各離差平方和:,ST=757.41-516.43=240.98, fT=16-1=15 SA=672.07-516.43=155.64, fA=3-1=2 Se= 240.98-155.64=85.34, fe=15-2=13,(4)列方差分析表:,[例2.1-3]方差分析表,(5) 如果給定 =0.05,從F分布表查得,由于F3.81,所以在α=0.05水平上我們的結(jié)論是因子A是顯著的。這表明不同的中小喉管結(jié)構(gòu)生產(chǎn)的化油器的平均比油耗有明顯的差異。,我們還可以給出不同結(jié)構(gòu)生產(chǎn)的化油器的平均比油耗的估計:,這里加上220是因為在原數(shù)據(jù)中減去了220的緣故。,由此可見,從比油耗的角度看,兩種改進結(jié)構(gòu)都比原來的好,特別是改進結(jié)構(gòu)1。,在本例中誤差方差的估計為6.56,標準差的估計為2.56。,2.3.2 回歸分析,例2.2-1 合金的強度y與合金中的碳含量x有關(guān)。為了生產(chǎn)出強度滿足顧客需要的合金,在冶煉時應(yīng)該如何控制碳含量?如果在冶煉過程中通過化驗得到了碳含量,能否預(yù)測合金的強度?,這時需要研究兩個變量間的關(guān)系。首先是收集數(shù)據(jù)(xi,yi),i=1,2, …,n。現(xiàn)從生產(chǎn)中收集到表2.2-1所示的數(shù)據(jù)。,表2.2-1 數(shù)據(jù)表,一、散布圖,[例2.2-1]的散布圖,二、相關(guān)系數(shù),1.相關(guān)系數(shù)的定義,在散布圖上 n 個點在一條直線附近,但又不全在一條直線上,稱為兩個變量有線性相關(guān)關(guān)系,可以用相關(guān)系數(shù) r 去描述它們線性關(guān)系的密切程度,其中,性質(zhì):,表示n個點在一條直線上,這時兩個變量間完全線性相關(guān)。,r0表示當x增加時y也增大,稱為正相關(guān),r0表示當x增加時y減小,稱為負相關(guān),r=0表示兩個變量間沒有線性相關(guān)關(guān)系,但并不排斥兩者間有其它函數(shù)關(guān)系。,2.相關(guān)系數(shù)的檢驗,若記兩個變量x和y理論的相關(guān)系數(shù)為 ,其中x為一般變量,y服從等方差的正態(tài)分布,則,對給定的顯著性水平 ,當 可以認為兩者間存在一定的線性相關(guān)關(guān)系, 可以從表2.2-2中查出。(其中n為樣本量)。,3.具體計算,求上例的相關(guān)系數(shù):,步驟如下:,(1)計算變量x與y的數(shù)據(jù)和:,Tx= =1.90, Ty= =590.5,(2)計算各變量的平方和與乘積和:,(3)計算Lxx,Lyy,Lxy:,Lxy =95.9250-1.90×590.5/12=2.4292,Lxx =0.3194-1.902/12=0.0186,Lyy =29392.75-590.52/12=335.2292,,(4)計算r:,在 =0.05時, ,由于r0.576,說明兩個變量間有(正)線性相關(guān)關(guān)系。,四、一元線性回歸方程,1. 一元線性回歸方程的求法:,一元線性回歸方程的表達式為,其中a與b使下列離差平方和達到最?。?通過微分學原理,可知,,,稱這種估計為最小二乘估計。,b 稱為回歸系數(shù);a一般稱為常數(shù)項。,? 求一元線性回歸方程的步驟如下:,(1)計算變量x與y的數(shù)據(jù)和Tx,Ty; (2)計算各變量的平方和與乘積和; (3)計算Lxx,Lxy; (4)求出b與a;,利用前面的數(shù)據(jù),可得:,b=2.4392/0.0186=130.6022,a=590.5/12-130.6022 ×1.90/12=28.5297,(5)寫出回歸方程:,畫出的回歸直線一定通過(0,a)與 兩點,上例:,或,2. 回歸方程的顯著性檢驗,有兩種方法:,一是用上述的相關(guān)系數(shù);,二是用方差分析方法(為便于推廣到多元線性回歸的場合),將總的離差平方和分解成兩個部分:回歸平方和與離差平方和。,總的離差平方和:,回歸平方和:,離差平方和:,且有ST=SR+SE,其中,它們的自由度分別為:,fT=n-1,fR=1,fE=n-2=fT-fR,計算F比,,對給定的顯著性水平 ,當 時認為回歸方程是顯著的,即回歸方程是有意義的。一般也列成方差分析表。,對上面的例子,作方差分析的步驟如下:,根據(jù)前面的計算,(1)計算各類平方和:,ST=Lyy=335.2292, fT=12-1=11 SR=bLxy=130.6022×2.4292=317.2589,fR=1 SE=335.2292-317.2589=17.9703, fE=11-1=10,(2)列方差分析表:,[例2.2-1]的方差分析表,對給定的顯著性水平 =0.05,有,F0.95(1,10)=4.96,由于F4.96,所以在0.05水平上認為回歸方程是顯著的(有意義的)。,3.利用回歸方程進行預(yù)測,對給定的 ,y的預(yù)測值為,概率為 的y的預(yù)測區(qū)間是,其中,當n較大, 與 相差不大,那么可給出近似的預(yù)測區(qū)間,此時,進行預(yù)測的步驟如下:,(1)對給出的x0求預(yù)測值,上例,設(shè)x0 =0.16,則,(2)求 的估計,上例有,(3)求,上例n=12,如果求概率為95%的預(yù)測區(qū)間,那么t0.975(10)=2.228,所以,(4)寫出預(yù)測區(qū)間,上例為(49.43-3.11,49.43+3.11)=(46.32,52.54),由于u0.975=1.96,故概率為0.95的近似的預(yù)測區(qū)間為:,∵,∴,所求區(qū)間:,(49.43-2.63,49.43+2.63)=(46.80,52.06),相差較大的原因總n較小。,四、可化為一元線性回歸的曲線回歸,在兩個重復的散布圖上,n個點的散布不一定都在一條直線附近波動,有時可能在某條曲線附近波動,這時以建立曲線回方程為好。,1. 確定曲線回歸方程形式,2. 曲線回歸方程中參數(shù)的估計,通過適當?shù)淖儞Q,化為一元線性回歸的形式,再利用一元線性回歸中的最小二乘估計方法獲得。,回歸曲線的形式:,(1) ,(a0,b0),(2) ,(b0),(3) ,(b0),(4) ,(b0),3. 曲線回歸方程的比較,常用的比較準則:,(1)要求相關(guān)指數(shù)R大,其平方也稱為決定系數(shù),它被定義為:,(2)要求剩余標準差s小,它被定義為:,2.3.3 試驗設(shè)計,一、試驗設(shè)計的基本概念與正交表,(一)試驗設(shè)計,多因素試驗遇到的最大困難是試驗次數(shù)太多,若十個因素對產(chǎn)品質(zhì)量有影響,每個因素取兩個不同狀態(tài)進行比較,有210=1024、如果每個因素取三個不同狀態(tài)310=59049個不同的試驗條件,? 選擇部分條件進行試驗,再通過數(shù)據(jù)分析來尋找好的條件,這便是試驗設(shè)計問題。通過少量的試驗獲得較多的信息,達到試驗的目的。,? 利用正交表進行試驗設(shè)計的方法就是正交試驗設(shè)計。,(二)正交表,,“L”表示正交表,“9”是表的行數(shù),在試驗中表示試驗的條件數(shù),“4”是列數(shù),在試驗中表示可以安排的因子的最多個數(shù),“3”是表的主體只有三個不同數(shù)字,在試驗中表示每一因子可以取的水平數(shù)。,正交表具有正交性,這是指它有如下兩個特點:,(1)每列中每個數(shù)字重復次數(shù)相同。,在表L9(34)中,每列有3個不同數(shù)字:1,2,3,每一個出現(xiàn)3次。,(2)將任意兩列的同行數(shù)字看成一個數(shù)對,那 么一切可能數(shù)對重復次數(shù)相同。,在表L9(34)中,任意兩列有9種可能的數(shù)對: (1,1),(1,2),(1,3),(2,1),(2,2),(2,3),(3,1),(3,2),(3,3)每一對出現(xiàn)一次。,常用的正交表有兩大類,(1) 一類正交表的行數(shù)n,列數(shù)p,水平數(shù)q 間有如下關(guān)系:,n=qk, k=2,3,4,…, p=(n-1)/(q-1),如:L4(23),L8(27),L16(215),L32(231)等,可以考察因子間的交互作用。,(2)另一類正交表的行數(shù),列數(shù),水平數(shù)之間 不滿足上述的兩個關(guān)系,如: L12(211),L18(37),L20(219),L36(313)等,? 這類正交表不能用來考察因子間的交互作用,? 常用正交表見附錄,二、無交互作用的正交設(shè)計與數(shù)據(jù)分析,試驗設(shè)計一般有四個步驟:,1. 試驗設(shè)計 2. 進行試驗獲得試驗結(jié)果 3. 數(shù)據(jù)分析 4. 驗證試驗,例2.3-1 磁鼓電機是彩色錄像機磁鼓組件的關(guān)鍵部件之一,按質(zhì)量要求其輸出力矩應(yīng)大于210g.cm。某生產(chǎn)廠過去這項指標的合格率較低,從而希望通過試驗找出好的條件,以提高磁鼓電機的輸出力矩。,(一)試驗的設(shè)計,在安排試驗時,一般應(yīng)考慮如下幾步:,(1)明確試驗?zāi)康?(2)明確試驗指標,(3)確定因子與水平,(4)選用合適的正交表,進行表頭設(shè)計,列出試驗計劃,在本例中:,試驗?zāi)康模禾岣叽殴碾姍C的輸出力矩,試驗指標:輸出力矩,確定因子與水平:經(jīng)分析影響輸出力矩的可能因 子及水平見表2.3-2,表2.3-2 因子水平表,選表:首先根據(jù)因子的水平數(shù),找出一類正交表,再根據(jù)因子的個數(shù)確定具體的表,把因子放到表的列上去,稱為表頭設(shè)計把放因子的列中的數(shù)字改為因子的真實水平,便成為一張試驗計劃表,每一行便是一個試驗條件。在正交設(shè)計中n個試驗條件是一起給出的的,稱為“整體設(shè)計”,并且均勻分布在試驗空間中。,試驗計劃與試驗結(jié)果,9個試驗點的分布,(二)進行試驗,并記錄試驗結(jié)果,在進行試驗時,要注意幾點:,1. 除了所考察的因子外的其它條件,盡可能保持相同,2. 試驗次序最好要隨機化,3. 必要時可以設(shè)置區(qū)組因子,(三)數(shù)據(jù)分析,1. 數(shù)據(jù)的直觀分析,(1)尋找最好的試驗條件,在A1水平下進行了三次試驗:#1,#2,#3,而在這三次試驗中因子B的三個水平各進行了一次試驗,因子C的三個水平也各進行了一次試驗。,在A2水平下進行了三次試驗:#4,#5,#6,在這三次試驗中因子B與C的三個水平各進行了一次試驗。,在A3水平下進行了三次試驗:#7,#8,#9,在這三次試驗中因子B與C的三個水平各進行了一次試驗。,將全部試驗分成三個組,那么這三組數(shù)據(jù)間的差異就反映了因子A的三個水平的差異,為此計算各組數(shù)據(jù)的和與平均:,? T1=y1+y2+y3=160+215+180=555,,=T1/3=185,? T2=y4+y5+y6=168+236+190=594,,=T2/3=198,? T3=y7+y8+y9=157+205+140=502,,=T3/3=167.3,同理,對因子B與C將數(shù)據(jù)分成三組分別比較,所有計算列在下面的計算表中,例2.3-1直觀分析計算表,(2)各因子對指標影響程度大小的分析 極差的大小反映了因子水平改變時對試驗結(jié)果的影響大小。這里因子的極差是指各水平平均值的最大值與最小值之差,譬如對因子A來講:,RA=198-167.3=30.7,其它的結(jié)果也列在上表中。從三個因子的極差可知因子B的影響最大,其次是因子A,而因子C的影響最小。,(3)各因子不同水平對指標的影響圖,從圖上可以明顯地看出每一因子的最好水平A2,B2,C3,也可以看出每個因子對指標影響的大小RBRARC。,圖2.3-2 因子各水平對輸出力矩的影響,由于正交表的特點,使試驗條件均勻分布在試驗空間中,因此使數(shù)據(jù)間具有整齊可比性,上述的直觀分析可以進行。但是極差大到什么程度可以認為水平的差異確實是有影響的呢?,2. 數(shù)據(jù)的方差分析,要把引起數(shù)據(jù)波動的原因進行分解,數(shù)據(jù)的波動可以用離差平方和來表示。,正交表中第j列的離差平方和的計算公式:,其中Tij為第j列第i水平的數(shù)據(jù)和,T為數(shù)據(jù)總和,n為正交表的行數(shù),q為該列的水平數(shù),該列表頭是哪個因子,則該Sj即為該因子的離差平方和,譬如SA=S1,正交表總的離差平方和為:,在這里有:,[例2.3-1]的方差分析計算表,? 第4列上沒有放因子,稱為空白列。S4僅反映由誤差造成的數(shù)據(jù)波動,稱為誤差平方和。,Se=S4,? 利用 可以驗證平方和的計算是否正確。,[例2.3-1]的方差分析表,因子A與B在顯著性0.10與0.05上都是顯著的,而因子C不顯著。,3. 最佳條件的選擇,對顯著因子應(yīng)該取最好的水平;,對不顯著因子的水平可以任意選取,在實際中通常從降低成本、操作方便等角度加以選擇。,上面的例子中對因子A與B應(yīng)該選擇A2B2,因子C可以任選,譬如為節(jié)約材料可選擇C1。,4. 貢獻率分析方法,當試驗指標不服從正態(tài)分布時,進行方差分析的依據(jù)就不夠充足,此時可通過比較各因子的“貢獻率”來衡量因子作用的大小。由于S因中除因子的效應(yīng)外,還包含誤差,從而稱S因-f因Ve為因子的純離差平方和,將因子的純離差平方和與ST的比稱為因子的貢獻率。,(四)驗證試驗,對A2B2C1進行三次試驗,結(jié)果為:234,240,220,平均值為231.3此結(jié)果是滿意的,三、有交互作用的正交設(shè)計與數(shù)據(jù)分析,例2.3-2 為提高某種農(nóng)藥的收率,需要進行試驗。,(一)試驗的設(shè)計,? 明確試驗?zāi)康?? 明確試驗指標,? 確定試驗中所考慮的因子與水平,并確定可能存在并要考察的交互作用,? 選用合適的正交表。,在本例中:,試驗?zāi)康模禾岣咿r(nóng)藥的收率,試驗指標:收率,確定因子與水平以及所要考察的交互作用:,因子水平表,還要考察因子A與B交互作用,選表:首先根據(jù)因子的水平數(shù),找出一類正交表再根據(jù)因子的個數(shù)及交互作用個數(shù)確定具體的表。,把因子放到表的列上去,但是要先放有交互作用的兩個因子,并利用交互作用表,標出交互作用所在列,以便于今后的數(shù)據(jù)分析。,把放因子的列中的數(shù)字改為因子的真實水平,便成為一張試驗計劃表。,L8(27)的交互作用表,試驗計劃,(二)數(shù)據(jù)分析,1. 數(shù)據(jù)的方差分析,在二水平正交表中一列的離差平方和有一個簡單的計算公式:,其中T1j、T2j分別是第j列一水平與二水平數(shù)據(jù)的和,n是正交表的行數(shù),[例2.3-2]的計算表,[例2.3-2]的方差分析表,,,,,,,,,,,,,,,,,,,,其中:,SA=S1,SB=S2,SC=S4,SD=S7,SA×B=S3,Se=S5+S6,fA=fB=fC=fD=fA×B=1,fe=2,A×B的搭配表,2. 最佳條件的選擇,故最佳條件是:A2B1C2,A2B1的搭配為好,C取2水平為好。,(三)避免混雜現(xiàn)象——表頭設(shè)計的一個原則,選擇正交表時必須滿足下面一個條件:“所考察的因子與交互作用自由度之和≤n-1”,其中n是正交表的行數(shù)。不過在存在交互作用的場合,這一條件滿足時還不一定能用來安排試驗,所以這是一個必要條件。,例2.3-3 給出下列試驗的表頭設(shè)計:,(1)A、B、C、D為二水平因子,同時考察交互作用A×B,A×C,(2)A、B、C、D為二水平因子,同時考察交互作用A×B,C×D,(3)A、B、C、D、E為三水平因子,同時考察交互作用A×B,它們分別要用L8(27),L16(215),L27(313),測量系統(tǒng)分析(MSA),測量系統(tǒng)基本要求,準確性 Accuracy,精確性 Precision,測量系統(tǒng)基本要求,+,線性性 (Linearity),偏度(Bias),穩(wěn)定性(Stability),重復性(Repeatability),再現(xiàn)性(Reproducibility),準確性和精確性,,,,準確性描述了測量值和真實值之間的差異 精確性描述了使用同一工具重復測量相同部件時存在的差異,偏倚 (Bias),測量系統(tǒng)誤差的類型,觀測到的平均觀測值 和基準值之間的差異,穩(wěn)定性 (Stability),,測量系統(tǒng)誤差的類型,隨著時間推移 系統(tǒng)測量的準確性,線性 (Linearity),測量系統(tǒng)誤差的類型,部件的大小 如何影響測量系統(tǒng)的 準確性,重復性 (Repeatability),由同一操作者對同一部件用同一測量儀器的多次測量,測量系統(tǒng)誤差的類型,再現(xiàn)性 (Reproducibility),由不同操作者對同一部件用同一測量儀器的測量,測量系統(tǒng)誤差的類型,測量重復性和再現(xiàn)性 Gage R&R (repeatability and reproducibility),適用于所有列入控制計劃的測量系統(tǒng) 計量型 (Variable) 計數(shù)型 (Attribute),測量系統(tǒng)分析,測量重復性和再現(xiàn)性可接受標準 低于10% 誤差 -- 測量系統(tǒng)可接受 10% 至 30% 誤差 -- 考慮重要性、量具成本、維修成本可能接受 大于30%的誤差-- 需改,測量系統(tǒng)分析,Minitab中有關(guān)MSA部分,,,測量趨勢圖 測量線性和偏倚分析 測量重復性和再現(xiàn)性分析(交叉) 測量重復性和再現(xiàn)性分析(嵌套) 屬性協(xié)議分析,測量重復性和再現(xiàn)性研究,Gage R&R Study可對交叉式數(shù)據(jù)(crossed)和嵌套式數(shù)據(jù)(nested)進行精確性分析.,在Minitab如何組織這兩種數(shù)據(jù)的?,數(shù)據(jù)組織方式的差異,,,,,,,,,,相同,,,,不同,交叉式數(shù)據(jù),嵌套式數(shù)據(jù),交叉式數(shù)據(jù)分析,交叉式數(shù)據(jù)分析分為均值極差法(Xbar-R)和方差法(ANOVA)分析 均值極差法不考慮操作者與測量對象之間的交互作用 均值極差法將總測量變差分為三類:部件-部件,重復性和再現(xiàn)性 方差法將總測量變差分為四類:部件-部件,重復性,操作者,操作者-部件交互作用,交叉式數(shù)據(jù)分析-均值極差法,打開Minitab,從菜單選擇FileOpen Worksheet,打開工作表GAGEAIAG.MTW 從菜單選擇StatQuality ToolsGage StudyGage R&R Study(Crossed),交叉式數(shù)據(jù)分析-均值極差法,,,,,包含測量對象名稱或編號的列,包含操作者名稱或編號的數(shù)據(jù)列,包含測量值的列,,,選擇均值極差法,交叉式數(shù)據(jù)分析-均值極差法,,過程公差處輸入8,交叉式數(shù)據(jù)分析-均值極差法,結(jié)果分析: 量具分辨率(Number of Distinct Categories)反映了測量系統(tǒng)能夠區(qū)分的過程數(shù)據(jù)的分組數(shù).當該值大于5時,可接受.當小于2的時候,測量系統(tǒng)將無法區(qū)分部件. VarComp:顯示方差構(gòu)成來源 %Contribution:顯示每個方差項占總變差的百分比 StdDev:每個方差項的標準偏差 StudyVar:標準偏差*6,用于分析過程變差時使用 %Study Var:每個方差項的百分比,交叉式數(shù)據(jù)分析-方差法,打開Minitab,從菜單選擇FileOpen Worksheet,打開工作表GAGEAIAG.MTW 從菜單選擇StatQuality ToolsGage StudyGage R&R Study(Crossed),交叉式數(shù)據(jù)分析-方差法,,,,,包含測量對象名稱或編號的列,包含操作者名稱或編號的數(shù)據(jù)列,包含測量值的列,,,選擇方差法,交叉式數(shù)據(jù)分析-方差法,,過程公差處輸入8,交叉式數(shù)據(jù)分析-方差法,結(jié)果分析: 量具分辨率(Number of Distinct Categories)反映了測量系統(tǒng)能夠區(qū)分的過程數(shù)據(jù)的分組數(shù).當該值大于5時,可接受.當小于2的時候,測量系統(tǒng)將無法區(qū)分部件. VarComp:顯示方差構(gòu)成來源 %Contribution:顯示每個方差項占總變差的百分比 StdDev:每個方差項的標準偏差 StudyVar:標準偏差*6,用于分析過程變差時使用 %Study Var:每個方差項的百分比,嵌套式數(shù)據(jù)分析,打開Minitab,從菜單選擇FileOpen Worksheet,打開工作表GAGENEST.MTW 從菜單選擇StatQuality ToolsGage StudyGage R&R Study(Nested),嵌套式數(shù)據(jù)分析,,,,,包含測量對象名稱或編號的列,包含操作者名稱或編號的數(shù)據(jù)列,包含測量值的列,嵌套式數(shù)據(jù)分析,結(jié)果分析: 量具分辨率(Number of Distinct Categories)反映了測量系統(tǒng)能夠區(qū)分的過程數(shù)據(jù)的分組數(shù).當該值大于5時,可接受.當小于2的時候,測量系統(tǒng)將無法區(qū)分部件. VarComp:顯示方差構(gòu)成來源 %Contribution:顯示每個方差項占總變差的百分比 StdDev:每個方差項的標準偏差 StudyVar:標準偏差*6,用于分析過程變差時使用 %Study Var:每個方差項的百分比,測量趨勢圖,根據(jù)所有測量員和部件號所作的圖形 在圖中平均值的位置畫一條水平參考線 穩(wěn)定的測量過程,趨勢圖上的點將隨機分布在水平參考線兩邊,測量趨勢圖,打開Minitab,從菜單選擇FileOpen Worksheet,打開工作表GAGE2.MTW 從菜單選擇StatQuality ToolsGage StudyGage Run Chart,測量趨勢圖,,,,,,,包含測量對象名稱或編號的數(shù)據(jù)列,包含操作員名稱或編號的數(shù)據(jù)列,包含測量值的數(shù)據(jù)列,輸入試驗次數(shù),輸入水平參考線位置,測量線性和偏倚分析,線性性是衡量整個量程范圍內(nèi)測量精度的參數(shù) 偏倚是衡量平均值和真實值之間差異的參數(shù),測量線性和偏倚分析,打開Minitab,從菜單選擇FileOpen Worksheet,打開工作表GAGELIN.MTW 從菜單選擇StatQuality ToolsGage StudyGage Linearity and Bias Study,測量線性和偏倚分析,,,,,包含部件名或編號的數(shù)據(jù)列,包含測量基準值的數(shù)據(jù)列,包含測量數(shù)據(jù)的數(shù)據(jù)列,指定的過程變差值或者是過程公差,測量線性和偏倚分析,結(jié)果說明: %Linearity量具的線性度占總測量過程變差的百分比 %Bias量具偏倚占測量過程總變差的百分比,- 1.請仔細閱讀文檔,確保文檔完整性,對于不預(yù)覽、不比對內(nèi)容而直接下載帶來的問題本站不予受理。
- 2.下載的文檔,不會出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請點此認領(lǐng)!既往收益都歸您。
下載文檔到電腦,查找使用更方便
14.9 積分
下載 |
- 配套講稿:
如PPT文件的首頁顯示word圖標,表示該PPT已包含配套word講稿。雙擊word圖標可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計者僅對作品中獨創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- MINITAB 培訓 假設(shè)檢驗 方差 回歸 DOE MSA
鏈接地址:http://m.jqnhouse.com/p-1861664.html