本帖最后由 yangzhaosheng 于 2018-4-17 16:03 編輯
目前,有部分朋友認(rèn)為,做偏倚和線性的分析,其方法應(yīng)該按照手冊(cè)第三章第B節(jié)的指導(dǎo)進(jìn)行,為了方便讀者,我把關(guān)鍵的判據(jù)內(nèi)容摘錄如下(原版原文):
MSA手冊(cè)偏倚和線性判據(jù).png (28.27 KB, 下載次數(shù): 215)
下載附件
2018-4-17 15:53 上傳
準(zhǔn)確地意譯成中文就是:
“9) 在顯著性水平α下,如果滿足以下兩條中的一條就認(rèn)為偏倚在統(tǒng)計(jì)上為零:
? 關(guān)于統(tǒng)計(jì)量t bias的檢驗(yàn)P值<α;
或者
? 按下式,零落在1-α的置信區(qū)間內(nèi)(公式略,參見上面圖片)?!?/font>
請(qǐng)注意這里的關(guān)鍵字眼“or(或者)”,本文后面還會(huì)重點(diǎn)提到這個(gè)詞。
基于此,有朋友認(rèn)為應(yīng)采用如下報(bào)告形式:
MSA線性偏倚分析報(bào)告.jpg (1.21 MB, 下載次數(shù): 195)
下載附件
2018-4-17 15:53 上傳
相信這樣一份線性偏倚報(bào)告伴隨了一些小伙伴很久了吧?而且很多小伙伴也很認(rèn)真地執(zhí)行手冊(cè)的判據(jù)要求,認(rèn)為統(tǒng)計(jì)上,偏倚Bias=0成立,才能接受;否則,當(dāng)Bias≠0時(shí),這套測(cè)量系統(tǒng)就不能被接受。具體的方法就是看Bias=0的線是否落在95%的置信區(qū)間內(nèi)。
當(dāng)然,還有用回歸分析法的線性報(bào)告:
線性回歸分析報(bào)告--MSA.jpg (840.09 KB, 下載次數(shù): 199)
下載附件
2018-4-17 15:53 上傳
那么,類似于上述這兩種報(bào)告本身的邏輯是什么?
理論上,上述線性、偏倚分析報(bào)告的邏輯本身并沒有問題。我們先看第一份偏倚和線性的報(bào)告。這份報(bào)告的邏輯是基于假設(shè)t檢驗(yàn)法而進(jìn)行的判斷(當(dāng)然了,這是在總體方差σ2未知的情況下,如果總體方差σ2是已知的,我們就要用Z檢驗(yàn)法。區(qū)別是,t檢驗(yàn)法用到了樣本方差S2對(duì)總體方差σ2進(jìn)行無偏估計(jì)而得到的近似于Z檢驗(yàn)統(tǒng)計(jì)量的一種檢驗(yàn)統(tǒng)計(jì)量),判斷的結(jié)果是測(cè)量系統(tǒng)“是否存在顯著的偏倚和線性誤差”。請(qǐng)注意,僅止于此哦,它沒有進(jìn)一步的判斷!具體進(jìn)一步判斷后面會(huì)講,而且一定要講到,這很重要。
我們?cè)倏吹诙輬?bào)告,第二份報(bào)告的邏輯是基于一元線性回歸做的一份線性分析報(bào)告,當(dāng)然報(bào)告中是根據(jù)偏倚進(jìn)行計(jì)算的,但報(bào)告的目的僅僅是用于線性擬合優(yōu)度的判定。
在統(tǒng)計(jì)學(xué)上,我們通常把統(tǒng)計(jì)方法歸類如下:
統(tǒng)計(jì)方法分類.png (67 KB, 下載次數(shù): 198)
下載附件
2018-4-17 15:53 上傳
那么,回到MSA手冊(cè)第三章第B節(jié)的判據(jù)上來:
“9) 在顯著性水平α下,如果滿足以下兩條中的一條就認(rèn)為偏倚在統(tǒng)計(jì)上為零:
? 關(guān)于統(tǒng)計(jì)量t bias的檢驗(yàn)P值<α;——這個(gè)就是P值法
或者
? 按下式,零落在1-α的置信區(qū)間內(nèi)。——這個(gè)就是臨界值法”
前文讓小伙伴們注意“or(或者)”,這里要重點(diǎn)提一下這個(gè)“or(或者)”。無論是英文的“or”還是中文的“或者”,相信意思不用我解釋了吧。我想說的,手冊(cè)的給的兩個(gè)判據(jù),其作用是一樣的,只是方法不同,一個(gè)是“P值法”,一個(gè)“臨界值法”,我們用其中任何一種方法都是可以的。那么,為什么偏偏就有很多朋友會(huì)選擇第二條呢?
經(jīng)過個(gè)人反復(fù)對(duì)現(xiàn)存資料的對(duì)照研究發(fā)現(xiàn),其原因很是匪夷所思——翻譯工作的失誤。
經(jīng)過對(duì)照各種第四版MSA手冊(cè)的中文翻譯版本,總結(jié)了兩點(diǎn)翻譯上的失誤:
(A)把第一條給漏了
(B)在沒漏的情況下,把“or(或者)”翻譯成“如果符合以下兩種情況”。
這樣一來,很多朋友尤其是讀了“漏掉第一條”翻譯版本的朋友就會(huì)發(fā)生盲目堅(jiān)持“(A)”判據(jù)而無視“(B)”的情況。
而不去讀英文原版手冊(cè)的朋友一定也看不到這個(gè)“or(或者)”字,而這恰恰是偏倚方法優(yōu)選的根本理論依據(jù),這種優(yōu)選是放棄“臨界值法”從而選擇更加便捷而且優(yōu)于“臨界值法”的“P值法”。
為什么P值法是優(yōu)選的呢?
我們知道,假設(shè)檢驗(yàn)包括臨界值法和P值法兩種,用臨界值法確定原假設(shè)H0的拒絕域時(shí),例如當(dāng)α=0.05時(shí)我們知道要拒絕H0,再取α=0.01時(shí)我們一樣也能知道要拒絕H0,但我們不能知道將α再降低一些(注意,是一些,具體多少不清楚)是否還要拒絕H0,而P值法給出的是拒絕H0的最小顯著性水平α,因此,P值法比臨界值法給出了更多有關(guān)拒絕域的信息,更能涵蓋“拒絕”與“接受”的范圍,所以P值法在某種程度上是優(yōu)于臨界值法的,尤其是在只做判斷的而不是尋找拒絕域的情況下。
然而,偏倚分析工作做到這里只完成了一半,另一半工作還需要進(jìn)一步完成。
另一半工作是什么工作呢?
想要知道答案,我們必須先明白一個(gè)道理:那就是手冊(cè)給出的假設(shè)t檢驗(yàn)僅僅止于“是否存在顯著偏倚”(線性同理)的判斷,而存在的程度是多少呢?手冊(cè)并沒有明確說明。
那我們要不要知道這個(gè)“程度”呢,我們舉個(gè)計(jì)量學(xué)方面的例子來說明吧。
舉卡尺比較淺顯易懂,我們就說卡尺吧。
我們使用者當(dāng)然希望卡尺的誤差是沒有的吧?根據(jù)這樣的使用目的,我們要對(duì)某卡尺的誤差進(jìn)行探討,當(dāng)然應(yīng)進(jìn)行如下假設(shè):
原假設(shè)H0:卡尺誤差Δ=0
備擇項(xiàng)H1:卡尺誤差Δ≠0
假如通過取樣進(jìn)行t檢驗(yàn)我們得出結(jié)論:拒絕原假設(shè)H0
搞過計(jì)量的小伙伴們應(yīng)該都清楚卡尺在絕大多數(shù)情況下都是這種情況吧,換句話說,這把卡尺在統(tǒng)計(jì)上存在顯著的誤差。
問題來了,這把卡尺的誤差能被接受嗎?
答案當(dāng)然是:我們需要進(jìn)一步看看卡尺誤差的程度再做決定!
而誤差的程度在計(jì)量學(xué)上不就是“準(zhǔn)確度”嗎?和誰比?參考誰?有人說參考量塊,其實(shí)那只是確認(rèn)卡尺誤差的一個(gè)必要條件而已,卡尺誤差真正參考的是一個(gè)誤差限!和誤差限比,卡尺的誤差程度是多少,這才是我們關(guān)心的,至于你用量塊還是用別的什么標(biāo)準(zhǔn)件確定的誤差我不管,只要你符合量傳規(guī)則就行。
比如,我給出某測(cè)量點(diǎn)的誤差限是±0.03mm,經(jīng)過校準(zhǔn)發(fā)現(xiàn),卡尺的誤差Δ=+0.02mm,那么,這把卡尺的誤差是可以被接受的。
再強(qiáng)調(diào)一遍,t檢驗(yàn)確認(rèn)的是“是否存在顯著的誤差”的問題,而給出參考比值確認(rèn)的是“誤差的程度有多大”,這是一個(gè)遞進(jìn)的邏輯關(guān)系。
測(cè)量儀器的誤差可以這樣理解,測(cè)量系統(tǒng)的偏倚為什么就理解不了呢?
只不過要把測(cè)量儀器的“誤差限”換成“過程變差”或“公差范圍”,然后乘上100%,不就可以得到測(cè)量系統(tǒng)的偏倚程度了嗎?
而這種“程度”思想在Minitab公司的統(tǒng)計(jì)軟件中早就被廣泛地應(yīng)用,應(yīng)用的歷史要追溯到上個(gè)世紀(jì)70年代,只是測(cè)量系統(tǒng)的應(yīng)用在2000之后,但思想是一樣的。
而且,Minitab軟件得出的偏倚和線性分析結(jié)果包含了上述所提到的各個(gè)重點(diǎn),包括P值法、臨界值法、偏倚的程度(百分率)、線性的程度(百分率),甚至還包括一元線性回歸分析的擬合優(yōu)度R-sq等等。為了方便讀者朋友,我在下圖中一一標(biāo)注了出來(當(dāng)然,具體如何去解讀這個(gè)結(jié)果,由于篇幅和主題問題,我就不在這里展開了,具體可關(guān)注我們五度咨詢中心的微信公眾號(hào):MSA-wdzx,后續(xù)有機(jī)會(huì)我會(huì)逐步推出結(jié)果解讀的微文):
Minitab偏倚和線性.png (201.4 KB, 下載次數(shù): 209)
下載附件
2018-4-17 15:54 上傳
備注:
①臨界值法
②P值法
③偏倚和線性程度
④回歸分析的擬合優(yōu)度
試問,這么先進(jìn)的分析手段不用,我們還要用十幾年前的那張Excel表嗎?而且那張Excel表有多少小伙伴能從統(tǒng)計(jì)學(xué)上去解釋它的結(jié)果呢?它是使用效率有考慮過嗎?我們解釋不清楚,客戶一旦問起來怎么辦?忽悠嗎?
本文的編寫目的就是普及先進(jìn)的偏倚和線性分析方法和手段,不足的方法我們要——斷——舍——離——,好的方法要果斷引進(jìn)到實(shí)際工作中去,起到真正服務(wù)于質(zhì)量管理的作用。
線性是一個(gè)道理,我就不贅述了。
補(bǔ)充內(nèi)容 (2018-4-17 18:13):
盲目堅(jiān)持“(A)”判據(jù)而無視“(B)”的情況,這句話筆誤,正確的是:盲目堅(jiān)持“第二條”判據(jù)而無視“第一條”判據(jù)的情況,在此表示抱歉。 |