本帖最后由 史錦順 于 2015-12-11 08:30 編輯
-
njlyx提出一個測量學生身高的例子,我按不確定度的評定辦法,評定一番,給出的結果顯然違背常識。這就表明了不確定度評定的某些弊病。有人不大服氣。一則說老史沒遵守不確定度評定的規矩;再則說連個模型都沒有,不夠評定的資格;三則說題目本身是陷阱,是故意“挖坑”,意思是無端陷害不確定度理論。
這第三條,乃是科學研究中的“特例法”,就是舉出明顯的反例來,說明某種理論的弊病。因為,一種理論正確,此理論的各項必須全正確;而要否定一種理論,只要說明該理論的一條錯誤就夠了。Njlyx的例子,在說明“統計問題不能除以根號N”這一點上,簡單、明確,恰恰打中不確定度評定中不分“測量”與“統計”一律除以根號N的錯誤。倘因此而使一些網友正視不確定度評定的這個錯誤的話,則njlyx普及科學知識有功:挖坑是埋葬不確定度論的錯誤,可以避免一些人因“把錯誤當真理”而步入歧途,或者掉進“一律除以根號N”的陷阱。
至于另外的兩條,老史就不解釋了,老史的“評定”是按常規辦事的,對比后邊的兩個例子,即可證實。
后邊講的兩個例子,是著名的樣板。前一個是GUM自身的例子;后一個是國家計量院總工程師施昌彥的樣板評定,載于宣講GUM的書中。
所引兩篇文章,是幾年前寫的。主要說明:1 不確定度評定錯把對象的問題當測量手段處理,不當地除以根號N,錯誤是嚴重的、普遍的,不是僅在njlyx的特例中才有。2 老史的處理方式,與這兩個例子是相同的,不是老史的故意歪曲。
-----------------------
-
不確定度評定是一筆混沌賬
—— 例1《GUM》溫度測量評定
-
史錦順
-
一 混沌之源
1 被測量是什么
被測量(liáng)的量(liàng),稱為被測量(liàng)。經典測量的被測量是常量,只有唯一的值,即真值。統計測量的被測量是變量,設測量時間極短,是即時采樣,每一時刻的采樣值,各不一樣。即時采樣難以做到,于是定義采樣量值,取某時段(例如秒或毫秒)的平均值。統計測量的采樣量值各不一樣。對系統變化要測量變化率;隨機變化就測量其分散度(頻率測量特稱穩定度)
不確定度論怎樣看待被測量呢?GUM說可以是常量,也可以是統計變量。這就把截然不同的對象,混淆起來。這是第一個混沌之源。
2 A類評定
A類評定是不確定度全部評定的核心。因為B類評定是引用人家的材料,只有A類評定是本家特產。說來也好笑,大名曰A類,原來就是用測量儀器測量被測量,且僅此而已,并無任何條件。倘此條管用,豈不極其簡單易辦,何其大塊人心!何必去送檢,何必跑計量院。哈哈,真省事。
不行啊,老兄。世上沒有免費的午餐,沒有那么便宜的事。
A類評定,用儀器測量被測量,算西格瑪,這樣就把被測量的變化與儀器的隨機誤差攪在一起了。這是第二個混沌之源。
-
二 混沌的主要形式
不確定度的中國式宣貫中,有構成不確定度的人、機、料、法、環一說,查不到國際文件根據,算是國人的發揮吧。我不贊成此說,但覺得這個概括簡單、形象、上口,不管其本來目的如何,客觀上描述了不確定度的大雜燴面目。面目一露,揭示其本質就容易了。
在正確使用儀器的情況下,所謂人(目光正視等)、法(方法當然不能錯)、環(例如溫度影響)這三項都應該包括在儀器的指標中。本來測量儀器的性能僅僅取決于“機”,就是測量儀器;現在把“料”(被測量)加進來,是不應該的。
把測量儀器性能(系統誤差與隨機誤差,穩定性)與被測量的變化混在一起,是不確定度的混沌狀態的基本形式。
三 不確定度的實質
不確定度論把不確定度定義為“分散性”,分散性到底是啥,讓人說不清、道不明、參不透。領教不確定度論快二十年了,終于悟得如下一條名實大體符合的一條定義:
不確定度是由測量儀器誤差與被測量的變化以及環境影響等共同構成的測得值對期望值的偏離程度。
再次說明,這個定義是我下的。恰當不恰當?拆臺還是補臺?請讀者品評。我要說的是:不確定度的實質是混沌帳。
四 混沌導致的問題
我們舉個例子,說明:一律除以根號N ,嚴重低估被測量的變化。
GUM在給出不確定度的數量定義時,說的十分明白,西格瑪除以根號N叫A類不確定度(見葉書42頁)。本來,變量本身的分散性是西格瑪,被根號N除的結果就不是分散性了,而是一個縮小了根號N倍的值,此值太小了,用來表達被測量的變化性能,是極大的歪曲。
GUM有個測量溫度的例子(見葉書47頁,GUM2008版仍是同樣的數)。測得值如下(單位攝氏度):
-
96.90/98.18/98.25/98.61/99.03/99.49/99.56/
99.74/99.89/100.07/100.33/100.42/100.68/100.95/
101.11/101.20/101.57/101.84/102.36/102.72
-
95 96 97 98 99 100 101 102 103 104 105
1234567890123456789012345678901234567890123456789012345678901234567890123456789012345678901234567890123
{ o o o o o [o o o o o o o o o ]o oo o o o o }
-----------------------------------------------------------------------------------------------------------------------------------------
-
GUM就上列數據給出結果:σ=1.49℃;除以根號20,得標準不確定度u=0.33℃
溫度測得值的平均值是100.14℃,變化范圍是96.90℃到102.72℃。下半寬為3.24℃;上半寬是2.58℃。 如此大的變化是溫度計問題嗎?顯然不像,最普通的水銀溫度計,誤差也在0.2℃以下。從其0.01℃的分辨力來看,大概是優于普通溫度計的電子溫度計。數據的變化,應該是被測量的變化。溫度變化范圍是5.82℃,這是實實在在的溫度變化區間。
這個問題,顯眼是變量測量,是統計測量問題。用統計理論處理此問題,求到σ,就是溫度分散特性;Δ= 3σ= 4.5℃是極限偏差。由此給出指標±Δ,即±4.5℃;實測數據20個,都在所給區間內,符合邏輯。
請看GUM的處理。σ除以根號20,得不確定度u=0.33℃,此為標準不確定度;按GUM常例,k取2,于是得擴展不確定度U=0.66℃. 即數據包含區間的半寬是0.66℃. 區間高端是100.80℃;區間低端是99.48℃。對照實際數據,高端排除7個數,低端排除5個數。
一共才20個數據,不確定度論算出的區間,竟只包含8個數據,而排除12個數據。什么置信區間?什么包含區間?置信不可信,包含區間不包含。不確定度真不是東西!難怪計量院的一位副院長說它是“瞎扯淡”,馬鳳鳴說它是“吃飽撐的”,而一位網友說它是“洋垃圾”。
-------------------
-
不確定度評定是一筆混沌賬
—— 例2 溫度測量評定樣板
-
史錦順
-
評論對象:國家計量技術法規統一宣貫教材《測量不確定度評定與表征指南》
有下劃線的是原文摘抄,無下劃線的是史錦順的評論。
問題的提出 現有標稱溫度示值被調控到400℃的工業容器,測量人員選用帶K型熱電偶的數字式溫度計來測量該容器內部某處的實際溫度。
從制造廠說明書查知數字溫度計的分辨力為0.1℃。準確度為±0.6℃。K型熱電偶每年校準一次,今年的校準證書表明其不確定度為2.0℃(置信水準為99%),在400℃時的修正值為0.5℃。當恒溫容器的指示器表明調控到示值400℃時,穩定半小時后從數字溫度計上重復測得10個顯示值di,如下(單位℃):
401.0;400.1;400.9;399.4;398.8;400.0;401.0;402.0;399.9;399.0
修正后的測量結果為 t=400.2℃+0.5℃=400.7℃
分析的主要點
平均值400.42℃
算殘差 殘差的平方和 按貝塞爾公式算單值的標準偏差
σ(d)= 1.03 ℃
平均值的標準偏差為σ(d)除以根號N,(N=10)得
σ(d平)= 0.33℃
主要不確定度來源及計算(單位℃)
來源 類型 原不確定度 得標準不確定度
測量重復性s(d平) A 0.33 0.33
儀表準確度mpe B 0.6 0.35
熱電偶校準 B 2.0 0.78
u(均方合成) 0.92
測量不確定度U=2u=1.8℃
測量結果 t=400.7℃ U=1.8℃
【史評】
此項評定樣板,有類似的例(見GUM4.4.3)。這里更詳細。此例評定,嚴格地按不確定度評定規則辦事,表現出不確定度評定的本來面目,比較全面地體現了不確定度論的弊病。如是,老史的評論就來勁了:我評的是不確定度論本身!
1表達混沌
計量與測量,對象是量。量分兩種:常量與變量。于是測量也就有兩類:常量測量與變量測量。
物理量的變化量遠小測量儀器誤差范圍的情況是常量測量,即經典測量,其理論被稱作誤差論。
測量儀器誤差范圍遠小于物理量變化量的情況是變量測量,又稱統計測量,要用統計理論。例如,當今頻率界的頻率穩定度測量就是統計測量。兩類測量交叉,產生一種特殊測量,那就是物理常數測量。用當時世界上最準確的測量儀器去測量宇宙間最穩定的量值,區分不開物理量的變化與測量儀器的誤差,只能二者混在一起。非當代最高水平的測量,即一般的精密測量,必須清楚自己是兩類中的哪一類,不得混沌地表達。因為兩類測量該用的σ,相差根號N倍!
當今,時頻測量計量界,無論測量與計量,分清這兩類,人們已形成習慣。或者選擇誤差滿足要求即誤差可忽略的頻率測量儀器,去測量信號源的頻率值及其變化量;或者選誤差范圍可略的頻率標準,被待考核的頻率計測量,以考查頻率計的指標,產生的偏差與變化量都算頻率計的。如果有人用10的-6次方的頻率計去測量10的-6次方級的晶振,那將被認為是不懂測量,因為這樣給出的表征量,無法確定該歸屬哪一方。頻率測量易精確,時頻界常取10比1;電子測量難精確,電子計量界一般取3比1.
回到本例,這是一筆混沌帳。表征量是恒溫容器的,還是測量儀器的,說不清。不知測量目的是什么,是容器的溫度控制水平還是考查測量儀器誤差?都不像。不明確測量目的,不根據需要選擇符合要求的測量儀器,拉過來就測,測了就評,也不管評的結果干什么用。這是不確定度論的弊病之一。本例體現了這一點。
2 概率錯位
統計理論是一門科學。它處理的對象是隨機事件或隨機變量。量值的隨機偏差,或者是測量的隨機誤差,應當用統計理論處理,但系統誤差是不能用統計方法處理的。對系統誤差找分布,求概率,特別是按處理隨機誤差的方式處理,是不對的,概率錯位了。系統誤差代表標準與測量儀器的水平,減小系統誤差是計量測量研究的主要任務。不確定度論忽視系統誤差,錯誤地處理系統誤差,是它的又一個弊病。
3 錯取標準偏差
表征隨機變量的分散程度的量是σ,即單值的標準偏差;而不是平均值的標準偏差σ(平)。統計測量的前提是測量儀器的誤差可略,測得值的每一個都是實際值,按貝塞爾公式算出的σ,是單值的標準偏差,正是它,是量值分散性的表征量。不確定度理論取平均值的標準偏差作為表征量(即有除以根號N的操作),這是個帶根本性的錯誤。也許有人說,國際組織,而且是八大國際組織有權作決定,就得用平均值的標準偏差做表征量。應知,權大不過理,人們一旦明白,還是認理的。著名的阿侖方差就是單值的表征量。經典測量理論可以用σ(平),因為隨機誤差可以減小而且應當減小。統計測量中,偏差是量的客觀屬性,人為地縮小對客觀量的表征,是錯誤的。不確定度定義是“分散性”,卻將分散性人為地低估根號N倍,這是一個極大的錯誤。
4 不要準確度
不確定度論從否定真值出發,否定誤差,否定準確度。目的是用不確定度一統測量計量領域,可惜不確定度沒那個本事,表達不了該表達的事。此例中一個重要的指標,即溫度控制的準確度,不確定度論沒法說,本例也就不說。不確定度理論不包含標稱值的事,因此該容器在這里標多少是沒關系的。此評定居然不用400攝氏度這個量!
本人1958年在北大半導體廠勞動一個月,用恒溫爐燒制熱敏電阻,最關鍵的是爐溫控制的準確度。在不確定度論的表達中,竟無控溫準確度這一項,要它作甚!
|