有關統計方法的概念與術語
湖北財經學院 李興仁
4.1 什么叫統計方法?
測量不確定度的A類評定方法定義為統計方法。所謂統計,一般來說,是指根據從總體中隨機取出的樣本中所獲得的信息來推斷關于總體性質的方法。
一個被測量的某種條件(重復性條件或復現性條件)下的任一個測量結果,可視為無限多次測量結果(總體)的一個樣本。通過有限次數的測量結果(有限的隨機樣本)所獲得的信息(例如:平均值 大小、實驗標準偏差s(y)),來推斷總體的平均值(稱之為總體均值μ或稱為該分布的期望值)以及總體標準差σ,就是一種統計方法。
4.2 什么是期望、期望值與最佳估計?
在不確定度評定中,無限多次的重復性條件下或復現性條件下的測量結果的平均值以及非等精度條件下的加權平均值,均為期望值或簡稱期望。它也是總體的均值μ,只是理論上存在。
有限次數的測量結果都只是被測量的一個估計。當重復了若干次測量,得到若干個測量結果時,只有它們的平均值才是最佳估計,如果存在修正值,則只能是修正后的結果才是最佳估計。
任何一個估計及最佳估計值均具有不為零的不確定度,而期望值的不確定度恒等于零。
4.3 什么是概率?概率分布與主觀概率、先驗概率?
某種事件A出現的可能性大小的定量描述。例如,一個被測量Y在一個重復性條件下的測量結果y1中,所包含的隨機誤差分量是正值還是負值,其可能性一樣大,我們說,正與負的概率各為50%。如果兩次測量結果y1與y2中所出現的隨機誤差分量的符號相同(均為正值或均為負值),與符號不相同(一正一負)的概率也各為50%。三個重復測量結果y1、y2與y3中隨機誤差分量的符號相同,其概率就只有25%。
大大小小地合理賦予被測量Y之值yi,在其分散區間內等間隔地分成若干(例如15個)小的區間,則yi分別落在這些小區間中的數目多少,表明了落在這個區間的概率大小,這樣,如以縱坐標表示概率,則形成了一個概率分布曲線。下圖就是一個近似正態的分布曲線,Δδi為每個小間隔。
曲線表明了被測量可能值在多大時出現的概率有多大,同時,也可通過曲線估計出95%或99%的概率出現在哪個區間,即所謂置信區間(參閱3.7)。如要確定概率分布曲線,往往需要有100~200次的重復測量結果。所謂先驗概率又稱主觀概率,則是根據觀測者的實踐經驗,對某種事件出現的概率所作出的估計。
常見的用于不確定度評定的、較為規律的概率分布曲線有:矩形分布(又稱均勻分布)、三角分布、梯形分布、兩點分布等。其中以正態分布最為常見。例如:三個以上觀測值的平均值作為被測量的結果時,這種測量結果的分布即為正態分布。
4.4 異常值指什么?
由于測量條件或測量設備的某種偶然性變化,導致測量已不處于統計控制狀態;或者由于觀測、計算、記錄中的失誤,導致某測量結果明顯偏離其所屬樣本的其余觀測值,這樣的值稱為異常值,過去,我們說結果中含有粗大誤差。在不確定度評定中,這樣的值是不應進入計算而應剔除的。但必須持慎重態度,必須按有關規則進行。特別是當觀測結果較少(例如4次)的情況下,憑4個觀測值來判定其中某一次是異常值往往會作出錯誤結論。一般應再多重復若干次,有了例如7~8次以上的值后,再判斷哪一次的結果是否為異常值。國家標準GB4883—1985《正態樣本異常值的判斷和處理》可作為依據。
4.5 什么叫數學模型?
用數學語言給出的物理量之間或數值之間的關系式。測量的數學模型指得到被測量Y的數學計算式。因此,同一個被測量按所選擇的測量方法不同而有不同的數學模型。例如要測量一個球體的密度ρ,當我們選用天平、砝碼以及已知密度ρ0的液體,用兩次稱重(空氣中的稱重與浸入液體中的稱重)的方法得出時,
ρ=m/(m-m′)?ρ0
式中m為在空氣中稱出的質量,m′為在浸入液體中稱出的質量。但是,當我們采用測量球體體積V的方法時,就有了另外的數學模式:
ρ=m/V
如果考慮了某種修正的計算,相應地,數學模型會有一定程度的復雜化。
在不確定度評定中,我們一般把被測的量稱為輸出量。上例中的ρ就是。把與ρ有函數關系的、通常是直接用實驗測出的量,稱為輸入量,上例中的m、m′、ρ0以及V都是。這些輸入量也可能是由若干個量得出的,例如m可能是若干個砝碼之和,V是通過直徑測量并經過計算得出的,甚至測V時還有溫度的修正等。
數值關系式也可用于被測量的模型,必須注意是給定單位下的數值,其中包括經驗公式。
數學模型的一般表達式為:
Y=f(X1,X2,…,XN)
式中Y為被測量(輸出量),Xi是輸入量,小寫字母為它們的估計值有:
y=f(x1,x2,…,xN)
最簡單的模型如:Y=X。例如X是體溫計上的示值,而Y是體溫。如由兩個砝碼X1與X2在天平上平衡得出被測質量,則數學模型是:Y=X1+X2。如通過滴定管測出所消耗的溶液體積V,則滴定管上的兩次讀數(滴定的開始與終了)X1與X2同V之間的關系就是:V=X1-X2。如果用一個標準量塊的中心長度ls與被檢量塊中心長度l相比較的方法,用它們之間的差d來得出l時,數學模型只是l=ls+d;但如果考慮兩量塊間的溫度差δθ、溫度θ以及線膨脹系數差δα、線膨脹系數α的修正時,就成了:
l=ls+d-ls[δα?θ+α?δθ]。
必須注意,數學模型中不能進入帶有正負號(±)的項。(待續)
|
|