本帖最后由 史錦順 于 2012-4-4 17:58 編輯
兩種西格瑪-誤差與不確定度辨析(9)
史錦順
- (一)單值的西格瑪與平均值的西格瑪 西格瑪是方差的平方根。物理書上常稱其為均方根值。經典測量學稱其為標準誤差,變量統計理論稱其為標準偏差。 測量一組數據,共N個。代入貝塞爾公式計算。計算過程為:先求N個數據的平均值;各數據減平均值得N個殘差;每個殘差取平方;對各殘差的平方求和,得殘差的平方和;將殘差的平方和除以(N-1),再開方,即得到西格瑪。這是單值的西格瑪。此西格瑪表征每一個單個的測得值。也就是說,西格瑪是一組測量中各個單值的共同特征,是單值對期望值偏差的統計表征量,是單值的分散性的度量。在正態分布的條件下,三倍西格瑪是包含概率為99.73%的取值區間。 平均值的西格瑪,簡稱西格瑪(平)。西格瑪(平)等于西格瑪除以根號N。西格瑪(平)是平均值對期望值偏離的統計表征量。 - (二)基礎測量要用平均值的西格瑪 對常量的測量,稱基礎測量。 生活、生產、交易中的測量,是認識量值,求得量值,一般只測一次。 對常量進行精密測量,要進行多次。測一次是必要測量,另外的N-1次測量,是重復測量,又稱冗(róng)余測量。測得值的變化由測量儀器引起,測得值的分散性是手段問題,要用多次測量的方法減小手段的影響,要取平均值,用西格瑪(平)來表征測得值的平均值接近被測量真值的程度。 - 對慢變量的測量,實際是基礎測量。例如測量晶振的日老化率,必須進行時間間隔為1日的2次測量。這2次測量是必要測量。現在通常的作法是每隔一日測量一次,共7次測量,冗余量為5(7減2)。注意,這里的一次測量的“次”,應是三到五個測得值的平均值。 - 在基礎測量中,測得值的分散性由測量手段引入,稱隨機誤差。手段要改進,方法之一是增加測量次數,因而取平均值,用平均值的西格瑪來表征隨機誤差。 總之,基礎測量用平均值的西格瑪。 - (三)統計測量要用單值的西格瑪 對隨機快變量的測量,是統計測量。其模型是,每個測得值是準確值(誤差可略),測得值的變化,表現被測量本身的變化。取得單個測得值所用的時間稱采樣時間。每個測得值是采樣時間內的各時刻量值的平均值。單個測得值及其表征量,都是采樣時間的函數。這種表達模式,在時頻界,已成功應用。 - 對迅速變化的量,測量只能進行一次。如發射運載衛星的火箭,測速、測距都無法重復,因為速度在變,距離更在變,此刻的值不等于下一刻的值。這樣,對測量系統的要求,是單值的西格瑪,而不是平均值的西格瑪。 - 對統計測量來說,西格瑪是量值分散性的表征量,稱隨機偏差。3倍西格瑪是量值的變化范圍。平均值的西格瑪是平均值的變化特性,對單個客觀量的實際變化,已無實際意義。因此統計測量的表征量是單值的西格瑪,而不是平均值的西格瑪。 統計測量的標準偏差,是單值的西格瑪。 - 例1 狼的活動范圍 一座小山的巖石洞中,有個狼窩,住著狼和幾只狼崽。狼每天外出巡獵,又要顧及狼崽,不時回窩照看,這樣就大致有個行動范圍。狼離小山的距離,簡稱狼距,在一個區間內。設每天狼的活動規律大體相同。 一天中抽樣測量狼距,測10次,算西格瑪為20公里,取3西格瑪為狼距范圍,是60公里。狼距平均值的西格瑪是7公里,狼距平均值的范圍是20公里。 如一天中抽樣測量狼距1000次,算西格瑪為20公里,狼距范圍是60公里;西格瑪(平)為0.7公里,狼距平均值的范圍是2公里。 小山周圍是大草原,雜居著羊和兔。羊國布告:按狼距3西格瑪是危險區,即小山60公里范圍,羊等莫入。兔國布告:按狼距3西格瑪(平)是危險區,即小山2公里范圍(或寫成20公里),兔等莫入。 結果很明顯。3西格瑪是狼可能到達的范圍;3西格瑪(平)無安全上的意義。羊國以3西格瑪(60公里)為危險范圍是正確的。兔國采用3西格瑪(平),危險范圍僅2公里(或20公里),上當。 |