本帖最后由 yeses 于 2016-6-14 07:13 編輯
武漢大學 葉曉明
論文《The new concepts of measurement error theory》(Measurement, Volume 83, April 2016,Pages 96–105)的早期中文版曾投往國內某權威測量學報,其中有一段關于精度(精密度,precision)概念并非發散度的論述,強調單一測量結果并不存在離散問題。但是,這個版本卻被審稿人直接以現有文獻為依據給否定了,審稿人認為我連測繪學的精度概念都沒有理解清楚。
也許您也會說,精度可不就是測量結果的發散度嗎?現有測量教科書、測量標準(包括國際標準)等不都是把標準偏差解釋成分散度或分散性嗎?那么,我這里只能很遺憾地告訴您,您也沒有真正理解標準偏差的概念內涵。而且,不僅您,當前測量界真正正確地理解這個概念的人并不多。教科書、測量標準(包括國際標準)等都把標準偏差解釋成了測量結果的分散度或分散性,恰恰就說明了這個事實。
標準偏差是概率論中的概念,其定義就是σ2=E(X-EX)2。在現代測量中,有時用它表達精度(精密度),有時用它表達不確定度。但無論是精度還是不確定度,人們的思維總跟“離散度”、“發散性”糾結在一起,這些字眼在精度和不確定度的概念定義中都能看到。雖然有些學者已經注意到一個唯一的測量結果沒有發散性問題,卻又想當然地把它理解成未來重復測量結果的發散度,這仍然是個錯誤的理解。
標準偏差的概念解釋是現有測量理論的一大敗筆,作者在《現有測量學理論的幾大敗筆》(http://www.sciencenet.cn/dz/showdz.aspx?id=937)中也曾以珠峰高程結果8844.43米、標準偏差±0.21米為例指出過這個問題:
1、一個唯一的8844.43是沒有發散之說的。
2、也不能解釋成未來同樣測量條件下重復測量結果序列的發散度。因為如果同樣測量條件下重復測量,重復測量中各種測量條件(包括儀器內外各種環境條件、操作者的主觀條件等)都保持絕對不變(這實際不能實現),那必然是,每個測量的誤差形成過程一模一樣,測量結果將永遠是8844.43同一結果,測量結果序列也就不可能發散,離散度當然就是0。但每個結果的標準偏差卻都仍然還是±0.21,因為每個測量過程都是一模一樣。
3、也不能解釋成未來不同測量條件下重復測量結果序列的發散度。因為如果每次按不同條件進行重復測量,測量結果雖然會表現離散,但那跟當前的標準偏差沒有聯系。如果測量條件變化太隨意,結果序列必然過分離散;如果測量條件變化太少,離散度又將非常小;究竟多少變化條件剛好使離散度正好是±0.21米?只有天知道。
用珠峰高程做實驗不現實,但用一個電子秤做個稱重實驗總還容易實現。用電子秤的MPE(最大允許誤差)做依據分析出其稱量的某個重物重量的標準偏差,然后分別用同樣條件、不同條件重復測量試試看?看看重復測量的分散度跟前邊的標準偏差能吻合否?
那么,標準偏差概念的正確解釋究竟應該是怎樣的呢?
首先,我們得看看概率論是做什么的。很顯然,概率論研究的是一個未知事件的概率。一個已知事件是不存在概率問題的,一批已知事件也同樣不存在概率問題,事件都已經是確鑿已知的那還有什么概率可談呢?
其次,一個未知事件一定只能只有一個結果,如果這個事件的演變過程的來龍去脈規律都被人類完全掌握,那么這個結果就完全可以推定出來,就當然也不需要概率論了。而事實是,人類對各種自然規律的掌握只能做到有限,仍然有許多微觀細節的過程不能完全掌控,這些沒有掌控的過程是模糊不確定的,或者已經掌控的過程中仍然存在沒有完全掌控的模糊成分,甚至人們有時還有意地對已經掌握的規律過程也按模糊過程來處理。這些模糊的過程條件對結果的概率區間的影響畢竟都是有限的,這就是人類研究概率論的原因。就是說,事件結果未知不確定的根源是過程的模糊不確定,模糊不確定的過程條件當然就不能扯什么“同樣條件”字眼了。誰能保證硬幣的從拋出到著地的所有條件過程每次都是一模一樣?
那么,概率論是如何對一個未知事件的概率進行研究的呢?答案是,實驗統計和原理分析相結合。根據硬幣二面等概率原理推定拋擲試驗中各面朝上概率是50%,這就是原理分析;而根據大量拋擲實驗進行統計得出各面朝上概率是50%,這就是實驗統計。而諸如方差傳播率等也是原理分析方面的重要規律。
標準偏差的概念定義σ2=E(X-EX)2表達的實際就是一個實驗統計原理而已,通過對一批已知測量結果的離散性進行統計分析,評價其中任意一個測量結果單獨發生時所存在的概率區間,這才是分散性和概率的對應關系。獲得一個測量結果序列{Xi}(實驗樣本),通過σ2=E(X-EX)2計算出標準偏差σ,這樣,對于任意一個獨立發生的測量結果Xi來說,它就一定存在于一個以EX為數學期望以σ為標準偏差的概率區間內。就是說,當任意一個獨立的測量結果Xi被給定了以后,獨立測量結果與數學期望之差Xi-EX是個恒差,這個恒差存在于一個以0為數學期望以σ為標準偏差的概率區間內。也就是說,標準偏差σ是誤差Xi-EX所存在的概率區間的評價值,它表達誤差Xi-EX在概率區間內各點都有存在的可能,只是概率各不相同。但請特別注意,這并不是說誤差在概率區間內隨時間隨機不停地變化——絕對不可以這樣偷換概念!
因為測量結果序列{Xi}的獲取過程是存在模糊條件的,每一個Xi的形成條件都實際上存在差異,未來的測量條件與當前測量條件無法建立確鑿的比擬關系,我們自然不必要把當前的標準偏差和未來的測量結果糾纏在一起說事。我們只需說,在當前已有的n個Xi樣本中,任何一個獨立樣本與數學期望之差Xi-EX的標準偏差都是σ。這就足夠了。未來的測量自然有未來的測量結果,自然也會有它相應的標準偏差評價,是另外一回事情。
而進一步的事實是,當人們在測量實踐中獲取了n個離散的測量結果Xi的時候,這時必須按照一定的準則給出最佳唯一測量結果(測繪學叫平差)。譬如:按最小二乘原理可得出最佳唯一測量結果為其均值Y=(X1+X2+…+Xn)/n,這時唯一測量結果Y與數學期望之差Y-EX的標準偏差就是σ/√n了。
最終唯一測量結果與數學期望之差是個未知的恒差,這個恒差的大小程度用標準偏差來描述,標準偏差是一個含有概率意義的誤差存在范圍的概念,這才是標準偏差的概念實質。人們過去的誤區就是只注意到分散性統計,甚至跟什么白噪聲等聯系起來,而忽視了分散性統計的真實目的——評價一個測量結果的一個未知誤差的概率區間。把標準偏差、精度、不確定度等定義為分散性評價自然就不妥了。
現在,測量結果與數學期望之差——所謂的隨機誤差是個未知的恒差,這個恒差的大小程度可以用標準偏差來評價。那么,一個更進一步的問題是,數學期望與真值之差——所謂的系統誤差也是個未知的恒差,是否也可以用標準偏差來評價呢?答案當然是肯定的,這只需站在造成這個恒差的上游測量的角度看問題即可,而所有上游測量那里的測量統計分析的過程和當前測量過程在本質上實際是完全相同的。
當您理解到這里的時候,請接受我的歡迎,您已經走上了我的新概念誤差理論的主體思路:誤差都是恒差(站在給定測量結果的角度)、都遵循隨機分布且都有標準偏差評價其概率區間,誤差不存在系統和隨機的類別之分;誤差合成——代數法則,標準偏差合成——概率法則;精度、正確度和準確度就該作廢了,不確定度就有了很明確的概念內涵了。
2016 6 12于武漢大學 |