本帖最后由 史錦順 于 2017-12-31 10:00 編輯
-
偏差區間的包含概率的計算
-
史錦順
-
1 兩類測量的兩種方差
1.1 兩類測量
對常量的測量稱為基礎測量。經典誤差理論的應用范圍是基礎測量。基礎測量的條件是被測量的變化范圍遠小于測量儀器的誤差范圍。被測量有慢變化,但在測量時段內,變化可略,也是基礎測量。
在基礎測量中,隨機變化的誤差,稱隨機誤差;在測量的時段內為恒值的誤差,稱為系統誤差。測量者進行重復測量,即可認知隨機誤差;但因測量場合沒有計量標準,無法確定系統誤差。在計量場合,有計量標準,不僅可以測知隨機誤差范圍,也可以測知系統誤差。隨機誤差范圍與系統誤差范圍,在有計量標準的條件下,都可以通過測量來確定。
測量儀器的長期穩定度、環境條件等的影響量,體現在儀器機理設計中,并經過實踐考驗證實,儀器方能定型生產。生產廠在給出儀器性能指標時,是包含這部分內容的。就是說,儀器的性能指標,是指工作性能指標,包括使用條件(如溫度范圍等)、指標保證時段(通常為一年。也可給出三個月、半年、一年、三年的時段限制)。
計量只管當時的隨機誤差與系統誤差,不涉及長穩與環境溫度。如果在長穩與環境溫度方面出問題(非人工破壞或保管、使用不當),責任由生產廠負責。
-
1.2 兩種方差
在基礎測量中,儀器示值的隨機變化,是儀器自身的性能(外界影響也是通過儀器而體現出來的),與被測量無關,是儀器的隨機誤差。
測量值的方差的平方根是儀器的隨機誤差。多次測量,取平均值,可以減小隨機誤差。測量的隨機誤差范圍是3σ平。
-
在統計測量中,儀器的誤差可略,儀器示值的隨機變化,是被測量的隨機變化引起的。
測量值的方差的平方根是被測統計變量的隨機偏差。多次測量,取平均值。平均值是隨機變量的最佳代表值。各個測量值都是被測統計變量的真值(儀器誤差可略),測量結果是平均值加減偏差范圍。以平均值為中心的、以偏差范圍(3σ)為半寬的區間,對被測統計變量的包含概率是99.7%.
-
2 高斯正態分布的理論
2.1 有偏正態分布
高斯有偏正態分布的幾率密度函數為
p(Y) = {1/ [σ√(2π)]} exp [– (Y-μ)2 / (2σ2)] (1)
2.2 無偏正態分布
令ξ = Y-μ,則
Eξ =E(Y-μ)=EY – μ=0
ξ是期望值為0的純隨機變量。
高斯無偏正態分布的幾率密度函數為
p(ξ) = {1/ [σ√(2π)]} exp [– ξ2 / (2σ2)] (2)
2.3 標準正態分布
再令σ=1,并令x=ξ,則稱標準正態分布。標準正態分布的概率密度函數為
p(x) = [1/√(2π)] exp [– x2 / 2] (3)
正態分布的“概率函數”為
φ(x)= [1/√(2π)]∫(-∞→x) [exp (– t2 / 2)] dt (4)
《數學手冊》(1980版)給出的是公式(3)與公式(4)的數值表。本文據此計算。
-
3 正常情況下,統計變量偏差區間包含概率的計算
定義1 偏差
統計變量的量值與期望值之差。
定義2 偏差范圍
偏差范圍是偏差絕對值的一定概率意義上的最大可能值。
定義3 統計變量的量值區間
[M平-3σ,M平,M平+ 3σ]
用平均值代表被測的統計變量,是正確的,就是正常情況。所謂包含概率,就是以平均值為中心的、以偏差范圍為半寬的區間,包含各個統計變量的概率。
3.1 包含概率的規律
1)規律1 由概率函數定義,從-∞到k的概率是φ(k),
p(-∞→+k) =φ(k) (5)
-
2)規律2 從-∞到k的概率是φ(k),從k到+∞的包含概率是1-φ(k)。由于分布密度函數的對稱性,從-∞到-k的包含概率與k到+∞的概率相等,都是1-φ(k)。有
從-∞到-k的包含概率為
p(-∞→-k) = 1-φ(k)
φ(-k) = 1-φ(k) (6)
3)規律3 以平均值為中心的對稱區間的包含概率
p(-k→+k) = p(-∞→+k) – p(-∞→-k )
=φ(k) -φ(-k)
=φ(k) – [1-φ(k)]
=2φ(k)-1 (7)
-
3.2 包含概率的計算
3.2.1 區間 [M平-σ,M平,M平+σ] ,簡記為[-σ,+σ]
查表φ(1)=0.841345
k=1,代入公式(7),包含概率為
pσ = 2φ(1)-1=0.841345×2-1=1.68269-1
= 0.683 (8)
-
3.2.2 區間 [M平-2σ,M平,M平+2σ] ,簡記為[-2σ,+2σ]
查表φ(2)=0.977250,
k=2,代入公式(7),包含概率為
p2σ= 2φ(2)-1=0.977250×2-1=1.9545-1
= 0.9545 (9)
-
3.2.3 區間 [M平-3σ,M平,M平+3σ] ,簡記為[-3σ,+3σ]
查表φ(3)=0.998650
k=3,代入公式(7),包含概率為
p3σ= 2φ(3)-1=0.998650×2-1=1.9973-1
= 0.9973 (10)
以上(8)(9)(10)是以平均值為中心的正常情況,是測量計量工作者熟知的幾個重要數據。誤差理論主張取3σ為區間半寬,包含概率是99.73%;不確定度體系通常(默認)取2σ為區間半寬,包含概率是95.45%.
-
4 非正常情況,即不取平均值而取其他單值時,區間包含概率的計算
公式推導 設單值為Y平+ nσ , 區間半寬為kσ, 則區間為[(n-k) σ,(n+k)σ],有
K1=n-k
K2=n+k
當K為負值時,由于概率密度函數的對稱性,從-∞到K(負值)的包含概率與-K到+∞的概率相等,都為1-φ(-K)。當K為正值時,從-∞到K(正值)的包含概率就是φ(K)。
從-∞到K2的包含概率減去從-∞到K1的包含概率,就是所求的區間[(n-k) σ,(n+k)σ]的包含概率。
-
4.1 計算公式
4.1.1 (n-k)<0,(n+k)>0
P =φ(n+k) – [1-φ(k-n)] (11)
4.1.2 (n-k) ≥0
P=φ(n+k) -φ(n-k) (12)
-
3.2 計算舉例
例1 取Y=Y平+2σ,求半寬為3σ的區間的包含概率
k=3,n=2 按公式(11)計算
P =φ(n+k) – [1-φ(k-n)]
=φ(5)-[1-φ(1)]
≈φ(1)=0.841345
≈0.84
例2 取Y=Y平+2σ,求半寬為2σ的區間的包含概率
k=2,n=2 按公式(12)計算
P=φ(n+k) -φ(n-k)
=φ(4)- φ(0)
≈1-0.50
≈0.5
-
例3 取Y=Y平+3σ,求半寬為3σ的區間的包含概率
k=3,n=3 按公式(6)或(7)計算
P=φ(n+k) – [1-φ(k-n)]
=φ(6) – [1-φ(0)]
=φ(0)
= 0.5
例4 取Y=Y平+3σ,求半寬為2σ的區間的包含概率
k=2,n=3 按公式(7)計算
P=φ(n+k) -φ(n-k)
=φ(5) –φ(1)
=1-0.841345
= 0.16
說明:以上φ(6)、φ(5) 、φ(4)都近似為1.
-
總結
統計變量的分散性,是統計變量本身的特性,必須如實地描述、表達,不能人為地縮小。單值的標準偏差σ,隨著測量次數增大而趨于一個常數,它是隨機變量分散性的表征量。平均值的標準偏差σ平,隨著測量次數增大而縮小,并趨于零。σ平不是隨機變量的表征量。因此,表征隨機變量的分散性,必須用σ。
用σ表達分散性,而取值必須取變量的平均值,才有通常人們熟知的“以2σ為半寬的區間的包含概率是95.45%”、“以3σ為半寬的區間的包含概率是99.73%”。如果不取平均值而取其他單值,則包含區間的概率就會大大降低,如例1到例4。就是說:
1 統計測量,σ不能除以根號N。不論測量多少次。
2 量值必須取平均值。
-
附錄 統計測量,如果取σ平,即σ除以根號N,會是什么結果
(1)由于σ平=σ/√N,設N=25,則σ平=σ/5。此時以3σ平為半寬的區間為
[M平-3σ平,M平,M平+3σ平] (13)
因σ平=σ/5,代入(13)
[M平-0.6σ,M平,M平+0.6σ] (14)
根據公式(7)
p(-k→+k) = 2φ(k)-1
k=0.6 查表 φ(0.6)=0.725747
p(-0.6→+0.6) = 2φ(0.6)-1
= 2×0.725747 -1
=0.4515 (15)
(2)條件同上,此時以2σ平為半寬的區間為
[M平-2σ平,M平,M平+2σ平] (16)
因σ平=σ/5,代入(16)
[M平-0.4σ,M平,M平+0.4σ] (17)
根據公式(7)
p(-k→+k) = 2φ(k)-1
k=0.4 查表 φ(0.4)= 0.655422
p(-0.6→+0.6) = 2φ(0.4)-1
= 2×0.655422 -1
=0.3108 (18)
由以上計算可知,如果取σ平,以3σ平為半寬的區間,對隨機變量的包含概率是45.15%;以2σ平為半寬的區間,對隨機變量的包含概率是31.08%. 包含概率太低了!
-
思考題
在基礎測量(常量測量)中,要取σ平,怎樣說明“包含區間”與“包含概率”的問題呢?
-
|