本帖最后由 史錦順 于 2017-10-16 19:13 編輯
-
論測量儀器誤差的分布
-
史錦順
-
關于誤差分布的理論,對測量計量的實際工作很重要,直接關系到幾項實際工作的作法。
求知誤差分布規律的目的是什么?第一,合成誤差,包括建立誤差合成公式,如何由分項誤差求知總誤差,如何由幾項直接測量的誤差范圍求間接測量的誤差范圍;第二,決定包含因子k的取值;第三,決定包含因子與哪項相乘。
-
(一)統計方式的區分是認識分布規律的前提
誤差理論的核心是誤差分析與誤差合成。
誤差合成,要依據誤差分布規律。
誤差分布規律的前提是統計方式。
測量計量領域有兩種測量模式。兩種測量模式決定了兩種統計方式。
第一種測量模式是用一臺儀器多次(例如20次)測量同一個量。測量按時刻順序進行,測量值的不同,表現在時間領域中,對各個測量值的統計,稱為“時域統計”。
第二種測量模式是用同一種型號的多臺(例如20臺)儀器測量同一個量。測量按各臺編號,各臺儀器的測得值不同,對各個測得值的統計,稱為“臺域統計”。
-
測量儀器的實際應用,計量、測量、以及出廠檢驗、用戶驗收,都是第一種模式。因此,討論測量計量,統計方式必須是“時域統計”。制造廠的測量,主要是“時域統計”,有時也可能有第二種模式,即“臺域統計”。這種“臺域統計”是制造廠的事,涉及范圍很小。儀器出廠后,在計量、測量中,都不是用多臺儀器測量同一量(既無可能也無必要),因而“臺域統計”在計量、測量中沒有用場。就是說,測量計量學研究統計規律,必須是“時域統計”;研究分布,必須是“時域統計”中的量值或誤差的分布規律。
-
為了說明時域統計與臺域統計的區別,舉個有些類似的例子。盡管細節有區別,但在兩類統計的劃分的必要性上,是相通的。
假設有個“文體明星班”,看看該如何對明星們的身高進行統計。身高資料來自網上,不一定準確。
-
A 單位內成員的身高統計。“明星域”統計。
明星班有10位明星。司務長要給明星們準備禮儀服裝,每位明星的身高不同。大個子姚明用料多,小個子潘長江用料少。不能只看那個人的需要,而要進行統計,以求明星班身高的整體特性。于是進行如下的統計。
-
表1 明星班成員的身高資料
編號 姓名 身高 與平均值之差(mm)
1 姚明 2.26 m + 375
2 易建聯 2.13 m + 245
3 孫楊 1.98 m + 95
4 朱婷 1.95 m + 65
5 劉翔 1.89 m + 5
6 張光北 1.84 m - 45
7 唐國強 1.78 m -105
8 小沈陽 1.74 m -145
9 范冰冰 1.68 m -205
10 潘長江 1.60 m -285
身高平均值 1.885 m
分布規律 均勻分布(矩形分布)
-
B 個人的身高統計。時域統計。
裁縫受姚家委托為姚明準備四季服裝,包括買布。買布必須掌握姚明的身高資料。
資料1 從網上查得的數據:姚明身高 2.26 m(CBA數據);2.28m(NBA數據)
資料2 明星班的“明星域統計”結果(表1)
資料3 姚明在計量界的粉絲提供的姚明身高的精確測量的“時域統計”結果(虛構)。
-
表2 時域統計數據
重復測量20次,平均值2.260m
測量值與平均值之差(單位mm)
+3 1次
+2 2次
+1 4次
0 6次
-1 4次
-2 2次
-3 1次
平均值 2.260m
標準偏差 σ ≈ 1.5mm
分布規律 正態分布
偏差范圍 3σ = 1.5×3 =4.5 mm
美國火箭隊公布之身高,比統計平均值大20mm,差值遠大于3σ(4.5mm)。經記者查問,系穿鞋測量,多了鞋底的厚度。數據舍棄。
-
以上,可以看成是一段笑談。但有一點是值得思考的,那就是有兩種統計方式。
對明星班的統計結果,即平均值、標準偏差、分布規律,都是針對特定的明星班的統計結果。對明星班的后勤工作,該買多少布料,是有用的。
但是,明星班具體個人,離開明星班以后(類似于儀器出廠以后),原來在明星班中的“明星域統計”,對明星個人來說,是沒有用的。準備衣料要按自己身高的“時域統計”。明星班的身高平均值,按“明星域統計”得到的平均值1.885m,對姚明無用(對其他人也無用);給姚明準備衣料,必須按“時域統計”得到的身高值2.160m.
-
對測量儀器來說,通常認為的“均勻分布”,適用于對多臺儀器測量一個量的情況,僅僅在出廠前,分析批量產品性能時可用;測量儀器出廠后,計量、測量中是“用一臺儀器測量一個量”,必須是“時域統計”。
本文說明,在時域統計中,測量儀器的誤差分布是“有偏正態分布”。“純系統誤差”是“δ分布”,“純隨機誤差”是“無偏正態分布”。
-
(二)高斯正態分布理論
正態分布,有三種形式:有偏正態分布、無偏正態分布、標準正態分布。
1)有偏正態分布:測得值M,期望值μ(圖中M平代表),標準偏差σ,概率密度函數表達式為:
p(M) = {1/ [σ√(2π)]} exp [– (M-μ)2 / (2σ2)] (1)
2)無偏正態分布:期望值μ=0,標準偏差為σ.
隨機誤差元記為ξ,真值記為Z,系統誤差記為β
M= Z + β +ξ
ξ = M – Z – β = M- μ (2)
(2)代入(1),且以M平為零點,圖形平移,有
p(ξ) = {1/ [σ√(2π)]} exp [–ξ2 / (2σ2)] (3)
3)標準正態分布,期望值μ=0,標準偏差σ =1。令t =ξ/σ,則有
p(t) = {1/ [√(2π)]} exp (–t2 / 2) (4)
(4)式是數學手冊上的數值表的“標準正態分布概率密度函數”。
-
(三)測量儀器的誤差分布,是有偏正態分布
當前,不確定度體系的不確定度評定,絕大多數評者認為儀器的誤差分布是均勻分布,因而B類標準不確定度的公式為
uB = MPEV /√3 (5)
都成有不同觀點,他通過實驗,得知電能表的誤差分布是正態分布(無偏正態分布)。說儀器誤差是“均勻分布”的不確定度者,是一種想象,是假設,都成的實驗駁斥了“均勻分布”說。假設經過實驗證實,才是科學;假設與實驗不符合,就是謬說。假設而不證實,不是科學的作風。
科學理論,必須能證實,也能證否。不確定度體系與某些誤差理論書籍,把誤差劃分為“已知”“未知”兩種,又說對“未知的”才統計,這是錯誤的。分析與研究要根據事實,理論的最高原則是符合客觀規律。一種理論,不能用實驗證明,那就是錯誤的。都成的實驗,一組200臺,一組400臺,是很有說服力的實驗。都成的“正態分布說”正確,那就要否定“均勻分布說”。
不確定度的怪論說:我說的是未知的情況,已知的情況不能成為證據。這是掩蓋錯誤、拒抗實驗證實或證否的錯誤論調。
-
不確定度論者認為是“均勻分布”,相信不確定度體系的都成說是“正態分布”,內部矛盾了。哪個對呢?如果是臺域統計(出廠前的多臺儀器測量同一量),都成是對的,他有實驗事實。不確定度體系認定的“均勻分布”是錯誤的,因為與實驗事實不符。
但是,儀器的出廠檢驗,出廠后的計量、應用中的測量,這些通常的測量計量業務,都是用一臺儀器測量一個量,必須是“時域統計”。在時域統計中,高斯正態分布理論,二百年前已經用函數的形式給出,測量儀器的誤差分布是“有偏正態分布”。如圖1。
-
-
圖1 測得值區間選擇示意圖.jpg (31.18 KB, 下載次數: 325)
下載附件
2017-10-16 18:52 上傳
-
概率密度公式中的μ-Z(圖中以M平近似代表μ)是鐘形曲線的偏倚量,是系統誤差的值,是恒值。高斯給出的表達式,標準正態分布的曲線、概率積分數值表都是非常重要的。但高斯并沒有詳細討論那個偏倚值(系統誤差)。高斯的分析與計算,都是針對隨機誤差ξ。當今的學術界,把系統誤差β(μ-Z)硬往隨機誤差ξ上套,是行不通的。不同性質的對象,要用不同的方法處理。
對隨機變量,對隨機誤差,可以取方差;但對常量、對系統誤差,不能取方差。系統誤差的主要部分是恒值,而在重復測量(時段很短)中,系統誤差就是常量,常量的方差為零,因此“取方差的路線”,完全抹煞了系統誤差的存在與作用,是行不通的。整個不確定度體系的總設計,A類標準不確定度,B類標準不確定度,合成不確定度,擴展不確定度,都是為“走方差路線”而設立的。但是,因為系統誤差的方差為零,方差的路線走不通。
不確定度體系合成公式錯誤。包含因子乘錯地方,一招失手,全盤皆輸。
-
問:你說“測量儀器的誤差分布,是有偏正態分布”,有根據嗎?
老史回答:有。
第一,高斯正態分布曲線
關于誤差的高斯正態分布曲線,其中的偏倚值β=μ-Z是常量,就是測量儀器系統誤差之值。儀器一般都有系統誤差(頻標比對器等只有隨機誤差,那是很少的特例),因此測量儀器的誤差分布,一般是有偏正態分布。
第二,崔偉群指出:測量分兩種模式:第一種模式是一臺儀器重復測量一個量;第二種模式是多臺儀器測量同一量值。史錦順認為:單臺儀器測量必須用“時域統計”,而第二種模式是臺域統計。測量計量都是第一種模式,對應的必是“時域統計”。
第三,說“時域統計”中,單臺測量儀器誤差的分布是“有偏正態分布”,史錦順有大量實驗證明材料。上世紀八十年代,我國舉行過“全國高穩晶振比對會”三屆,每屆測量15天,每屆都有來自全國各地的優良晶振30臺到40臺,總計一百多臺次。對這三屆測量的數據(三本),筆者都進行了處理,并畫出漂移率圖形100多張。雖然未畫正態分布圖,但有一百多條老化率1E-9/日到2E-11/日的15天老化曲線,有五百多個短穩數據(每個數據來自100次重復測量),這樣,在時域統計中,在15天中,每臺儀器每天的“偏差分布圖”都是“有偏正態分布圖”,是極其肯定的。三屆,一百多臺次儀器,無一例外。
例如,比較著名的27所4號,每日鐘形線(σ)基本不變,而系統誤差的日變化(β的變化)是2E-11,這對比對會的要求(1E-7的準確度), 或平常檢定頻率計的要求(1E-8)小到數千分之一,是完全可以忽略的,應該認為系統誤差是恒值。
圖2 是4#晶振的頻率偏差示意圖。第1天到第15天,每天一張;肉眼幾乎看不出差別,這里選用第1天與第15天的兩張圖,其他圖都介于二者之間,從略。
-
圖2.1 4#晶振的頻率偏差分布示意圖 第1天
4#晶振偏差分布圖第1天.jpg (20.19 KB, 下載次數: 291)
下載附件
2017-10-16 18:48 上傳
-
圖2.2 4#晶振的頻率偏差分布示意圖 第15天
4#晶振偏差分布圖第15天.jpg (19.18 KB, 下載次數: 284)
下載附件
2017-10-16 18:40 上傳
晶振如此,各種精密測量儀器也都是這樣。用高等級的計量標準(在高檔次上代表真值),儀器與標準的誤差范圍比超過一百,于是,重復測量,得到的儀器誤差的統計直方圖,必將是有偏正態分布的近似圖。
客觀規律如此,各種分析,各種理論,必須建立在這個基礎上。
-
(四)誤差理論的基礎
測量儀器誤差的分布是“有偏正態分布”,討論誤差合成,推導誤差合成公式,必須以“有偏正態分布”為出發點。
-
4.1 純系統誤差是δ分布
高斯正態分布的幾率密度函數,對儀器誤差的表達是普適的。
p(M) = {1/ [σ√(2π)]} exp [– (M-μ)2 / (2σ2)] (1)
由公式(1),當隨機誤差越來越小,就是σ趨于0時,P(M)是μ點的δ函數。就是當M=μ時,概率密度無窮大(指數部分為0,e0為1;σ趨于0,則1/σ趨于無窮大),M≠μ時,指數趨于負無窮大(高階),概率密度為零。概率密度區間內積分為1。只要取區間半寬R大于系統誤差絕對值,包含概率100%.
由上分析,純系統誤差是δ分布。這是高斯誤差密度分布函數的必然結果。
-
4.2 純隨機誤差是無偏正態分布
(分析略)
4.3 既有系統誤差又有隨機誤差的儀器,誤差分布是“有偏正態分布”
(由高斯誤差定律決定)
4.4 包含因子只能用于隨機誤差的分散性
測得值區間的包含因子k,只能與隨機誤差的標準誤差相乘。系統誤差可以加大認定量,但不能乘包含因子。
不確定度體系的作法是在以系統誤差為主的儀器誤差上乘包含因子,是錯誤的作法。
-
|