本帖最后由 史錦順 于 2016-1-30 15:34 編輯
-
關于交叉系數論
—— 答qcdc(1)
-
史錦順
-
【qcdc質疑】
《費書》的例3-7是講圓柱體體積的誤差合成與分配,您可能沒有看仔細,測量直徑和高是用了兩種不同的儀器,即分別用了2級的千分尺和分度值為0.10mm的游標卡尺,請問這兩個量怎么相關?怎么用相關系數?最近您發明了“交叉系數”,等于+1或-1,似乎為您的取“絕對和法”找到了理論依據,但是,“交叉系數”理論是不存在的,請您三思!
-
【史答】
《費書》例3-7的測量工具本身誤差的獨立性,我并未忽視。
以往的理解,受“相關性”的影響很深。來自統計理論的“相關性”,被用來考慮“協方差”(錢鐘泰稱“交叉矩”)是否可忽略,人們習以為常,似乎既然來自統計理論,就必定是真理,毋容置疑。其實,對系統誤差(包括以系統誤差為主的測量儀器的誤差范圍)來說,這是個歷史性的錯誤。
原來,決定誤差合成方式的依據是“交叉系數”而不是“相關系數”。人們會明白,這項揭示,對誤差理論,對整個測量學理論都是重要的。
-
我知道,你對“以交叉系數代替相關系數”的觀點,持否定態度。沒關系,可以慢慢講道理、辯論。
-
我不是一眼就看穿這個問題的,而是經過了長時間的思考。經歷了幾個階段。對相關系數的求法、作用,不僅是三思,而是百思不得其解。而在追本溯源的探討中,得知本質是交叉項的問題,可以用交叉系數來描述,此后便一順百順。
有一位叫physics的網友,五個月前給我寫了一封信(在我不熟悉的欄目中,昨天才看到),表示愿意學習老史的理論。今天我把個人的觀點與有關交叉系數的理論,較詳細的寫出來(大部分是復制),一方面答復qcdc,也是對physics網友的體現尊師重道精神的來信的回復。至于某些不禮貌的帖子,我不想回應,由他去吧。不正視客觀規律,到頭來,吃虧的是他自己。
-
1 對相關系數公式的適用范圍的突破
科學不能憑印象,不能憑主觀估計。測量計量學是關于“量”的科學,評估不行,必須嚴格計算。計算依據公式。現行的相關系數公式為:
r=[1/(N-1)][∑[Xi-X(平)][(Yi-Y(平))] / [σ(X) σ(Y)] (a)
這個來自統計理論的公式(a),僅適用于隨機變量。
公式(a)對系統誤差的靈敏度為零。Xi加A,則X(平)也加A,Xi-X(平)必然消掉A。同樣,Yi加B,則Y(平)也加B,Yi-Y(平)必然消掉B。就是說系統誤差A、B不論是何值,不論A與B相關還是不相關,相關系數都是零。
因此,相關系數公式(a)不能用于對系統誤差合成問題的分析。于是,只得追根溯源,從頭分析。只得重新推導公式。
-
2 關于費先生的實例
圓柱體的兩個尺寸的測量誤差,可以說沒有關系,因為是不同測量工具測量出來的。也可以說有極強的關系,因為體積公式決定,直徑D與高度H,必須相乘才能求得體積,高度H與直徑D共同決定體積的大小。直徑D的誤差范圍與高度H的誤差范圍,共同決定體積值的誤差范圍。微分原理決定要取兩個誤差元的代數和。必須放在一起計算,就不能說它們間不相關。
H與D只知道誤差范圍,因此有誤差合成的求法問題。其實,相關還是不相關,對誤差合成問題都沒關系,本質是“交叉矩”能否忽略。系統誤差的交叉系數是±1,僅能取+1。《費書》的例子,誤差項只有兩項,必須取+1,因而必須取絕對和。取方和根是錯誤的。
-
3 要正視現實
史錦順的關于“誤差合成方式取決于交叉系數”的理論(簡稱“交叉系數論”)已在網上公布,這是客觀事實。你可以贊成,更可以反對,但說“不存在”,是不應該的。創辦《奇跡文庫》的旅美博士王彥宏介紹過,國際上,凡在學術專業網上發表文章,就被認定是已經發表。不能說紙上印的才有效,那是老黃歷。
任何理論都是人創造的。正確還是錯誤,取決于是否符合客觀規律。先生似乎認為只有前人的、被公認的理論才算“存在”,這是阻礙科學發展的狹隘觀點。
你應該對老史的“相關系數論”駁斥一番。我必定認真地思考、詳細地說明、嚴肅地辯論。只說一個“不存在”,無效。掛在網上,大家都看得到,怎能說“不存在”?
-
-
附言
再次感謝njlyx(李永新)、崔偉群二位先生。我從他們那里得知:系統誤差的相關系數是+1或-1。這大大促進了我對交叉系數的研究。
-
-
附錄:交叉系數論(史錦順 2015 鄭州)
(一)誤差合成的兩種思路
經典誤差理論的誤差合成,隨機誤差自身用“均方根法”,隨機誤差間用“方和根法”,系統誤差間用“絕對和法”。方法沒能統一。
GUM為代表的不確定度理論,統一采用“方和根法”,對隨機誤差的處理與經典誤差理論相同,沒有問題;但對系統誤差的處理,用“方和根法”,出現嚴重問題。第一,合理性問題。在系統誤差合成的條件下,二量和的平方的展開式的交叉項,不能忽略,交叉系數是+1或-1,因而此時不確定度評定中的“假設不相關”是不成立的。第二,為實行“方和根法”,帶來五項難題:(1)需知誤差量的分布規律、(2)化系統誤差為隨機誤差、(3)假設不相關、(4)范圍與方差間的往返折算、(5)計算自由度。其中有的很難,如(1)(4)(5);有的多數情況不對,如(3);有的不可能,如(2)。
筆者在網上討論的基礎上,提出統一處理誤差合成的“方根法”。“方根法”體現誤差量的“絕對性”與“上限性”兩個特點,著眼于誤差范圍,統籌隨機誤差與系統誤差的處理,把系統誤差元與隨機誤差元都變成是誤差范圍的直接構成單元,用取“方根”的辦法實現誤差的絕對值化。為此,用可正可負的恒值β代表系統誤差元;用三倍的隨機誤差元3ξi 代表隨機誤差對誤差范圍的貢獻單元。這樣,系統誤差β與隨機誤差元3ξ對誤差范圍的貢獻權重相同,都是1。于是,公式推導與合成處理,都方便,給出的處理辦法,十分簡潔。
不確定度理論的思路是將眾多的系統誤差化向隨機誤差。此乃“眾歸一”。但系統誤差多種多樣,化向隨機誤差很難,甚至不可能。這就是不確定理論煩難乃至不成立的根源。
本文的思路是使隨機誤差對誤差范圍的權重為“1”,使其與系統誤差權重相同。此乃“一從眾”。達到此目的的方法極其簡單,就是對隨機誤差元乘以3。
兩種思路,導致處理方法一繁一簡,難易分明。不確定度理論的煩難方法,基于不符合實際的臆想(用生產廠家不同、原理不同的多套儀器測量同一個量,系統誤差有分布);本文的方法是基于客觀實際(用同一套測量儀器,重復測量中系統誤差為恒值)的嚴格推導。是非曲直,昭然若揭。
-
(二)隨機誤差元構成的誤差范圍
隨機誤差的處理,經典誤差理論有成熟、完美的處理方法。
測量實踐中,人們易于認識隨機誤差。對常量的重復測量中,測得值的隨機變化就是隨機誤差。
隨機誤差元可大可小,可正可負。有四個特性:
(1) 單峰性:小誤差概率大;大誤差概率小
(2) 對稱性:數值相同的正負誤差概率大致相等
(3) 抵消性:求平均值時正負誤差可以抵消或大部分抵消
(4) 有界性:很大的誤差概率很小。(以3σ為半寬的區間,包含概率99.73)。
按統計理論,隨機誤差是正態分布。
-
對隨機誤差,有如下定義與關系:
1 隨機誤差元等于測得值減測得值的期望值(當無系統誤差時,期望值是真值)。隨機誤差元的期望值是零。隨機誤差元為:
ξi = Xi - EX (1)
2 標準誤差定義為
σ =√(1/N)∑ξi
=√(1/N)∑(Xi-EX) (2)
3 貝塞爾公式用測得值的平均值代換(2)式中的期望值,得到:
σ =√{[1/(N-1)]∑[X-X(平)]^2} (3)
4 隨機誤差范圍
R = 3σ =3√(1/N)∑ξi^2
=√(1/N)∑(3ξi)^2 (4)
5 由公式(4),有:
R=3σ(ξ)= σ(3ξ) (5)
隨機誤差元的3倍值(3ξ),其統計意義的方根值等于誤差范圍值。因此3ξ對誤差范圍的權重為1。因此3ξ在構成誤差范圍時與系統誤差的權重相同。以后,我們把隨機誤差元對誤差范圍的貢獻因子取為1/3,而系統誤差的貢獻因子取為1。
-
(三)單項系統誤差元構成的誤差范圍
系統誤差元用β表示。β是可正可負的恒值。
單個系統誤差構成的誤差范圍
R =√(1/N)∑(βi)^2
= |β| (6)
單個系統誤差對誤差范圍的貢獻是該系統誤差的絕對值。
-
(四)誤差合成的理論基礎
函數的改變量,等于函數對各個自變量偏微分的和。就是泰勒展開的一級近似。
f(x,y) = f(xo,yo)+ (?f/?x) (x-xo)+ (?f/?y) (y-yo) (7)
f(x,y) - f(xo,yo) =(?f/?x) Δx+ (?f/?y) Δy (8)
Δf =(?f/?x)Δx + (?f/?y)Δy (9)
公式(9)是偏差關系的普遍形式。對所研究的特定函數來說,?f/?x、?f/?y是常數。
偏差關系用于測量計量領域,x是測得值,xo是真值, Δx是測得值x的誤差元;y是測得值,yo是真值,Δy是測得值y的誤差元;f(x,y)是代表被測量的函數值, f(xo,yo) 是函數的真值,Δf= f(x,y)-f(xo,yo) 是函數值的誤差元。
-
(五)交叉系數的一般表達
設函數的誤差由兩項誤差Δx、Δy引起。由此,函數的兩項誤差元為:
Δf(x) = (?f/?x) Δx
Δf(y) = (?f/?y) Δy
把分項誤差作用的靈敏系數與該項誤差歸并,記為:
Δf(x) =ΔX
Δf(y) = ΔY
函數的誤差元式(9)變為:
Δf=ΔX +ΔY (10)
對(10)式兩邊平方并求和、平均:
(1/N)∑Δf^2=(1/N)∑(ΔX +ΔY)^2
=(1/N)∑ΔX^2 + 2(1/N)∑ΔXΔY+(1/N)∑ΔY^2 (11)
(11)式右邊的第一項為σ(X)^2,第三項為σ(Y)^2; (11)式右邊的第二項是交叉項,是我們研究的重點對象。交叉項 為
2(1/N)∑ΔXΔY =2【(1/N)(∑ΔXΔY) / {√[(1/N)∑ΔX^2]√[(1/N)∑ΔY^2]}】
×{√[(1/N)∑ΔX^2]√[(1/N)∑ΔY^2]}
= 2J√[(1/N)∑ΔX^2]√[(1/N)∑ΔY^2] (12)
(12)式中的J為:
J =(1/N)(∑ΔXΔY) / {√[(1/N)∑ΔX^2]√[(1/N)∑ΔY^2]} (13)
稱J為交叉系數。
(注:J在此前記為r,稱為相關系數。這和統計理論的相關系數,物理意義不一致。為澄清已有的混淆,本文稱J為交叉系數。)
-
(六)隨機誤差間合成的交叉系數
對隨機誤差的合成,ΔX是ξx, 代換為[X-X(平)];ΔY是ξy,代換為[Y-Y(平)],有:
J =[1/(N-1)][∑[Xi-X(平)][(Yj-Y(平))] / [σ(X) σ(Y)] (14)
由于ξx、ξy是隨機誤差,可正可負,可大可小,有對稱性與有界性,多次測量,是大量的,因此,隨機誤差間的合成的交叉系數為零(或可以忽略)。(14)式是當前不確定度論引用的統計理論的相關系數公式。
隨機誤差合成,“方和根法”成立,有
σ(f) =√[σ(X)^2+ σ(Y)^2] (15)
-
(七)隨機誤差與系統誤差合成的交叉系數
兩個分項誤差,一個是隨機的,記為ξ,考慮到對誤差范圍的權重,取單元量為3ξ(ΔX);一個是系統的(重復測量中不變),記為β(ΔY)。
代入公式(13),有
J =(1/N)(∑3ξiβ) / [σ(X) σ(Y)] (16)
系統誤差元是常數可以提出來,有
J =(1/N) (3β∑ξi) / {√[(1/N)∑ΔX^2]√[(1/N)∑ΔY^2]} (17)
大量重復測量(例如N=20,N不得小于10)中,(17)式的∑ξi等于零或可以忽略,因此J近似為0,可以忽略。“方和根法”成立。
-
(八)系統誤差與系統誤差合成的交叉系數
設(13)式中ΔX為系統誤差βx ,ΔY為系統誤差βy,有
√[(1/N)∑ΔX^2]= |βx| (18)
√[(1/N)∑ΔY^2]= |βy| (19)
則系統誤差的交叉系數為
J =(1/N)(∑βxβy) / [|βx| |βy|] (20)
=(1/N) (∑βxβy) / [ |βx| |βy| ]
=±1
即有
|J|=1 (21)
當βx與βy同號時,系統誤差的交叉系數為+1;當βx與βy異號時,系統誤差的交叉系數為-1.
當系統誤差的交叉系數為+1時,(11)式為:
| Δf | =|βx^2|+2|βx||βy| +|βy|^2
即有
| Δf | =|βx|+|βy| (22)
(22)式就是絕對值合成公式。
當系統誤差的交叉系數為-1時,(22)式變為二量差的公式。因為通常只是知道系統誤差之誤差范圍,又鑒于誤差量“上限性”的特點,二量差的公式不能用。
測量儀器的性能指標,給出的都是誤差范圍。
單值量具,如果上級計量已給出修正值(不是一般的測得值,必須是給出的帶有修正誤差的修正值),并且已按修正值使用,則該量具的隨機誤差與修正前相同;而修正后的系統誤差等于修正值的誤差[(標準的系統誤差與隨機誤差)+被檢儀器的隨機誤差]。
測量儀器,通常有幾千到幾十萬個測量點。上級計量部門通常只能給出十幾個到幾十個校準點的修正值。只有這些點(或很接近的點)能修正;杯水車薪,測量儀器的絕大部分的測量點是不能修正的。就是修正過的點,也還是有系統誤差的(等于校準時標準的系統誤差與隨機誤差,再加上被校儀器的隨機誤差)。由于被檢儀器的隨機誤差,經修正操作后轉化為被檢儀器的系統誤差,因此修正并不一定好。除單值量具外,通常,測量儀器是不修正的。
通常,測量儀器的誤差范圍指標值由生產廠家給出,由計量部門公證,測量者按儀器指標應用。直接測量,測量儀器的指標,就可看作是測量的誤差范圍(只要符合儀器使用條件,環境等的影響,已包含在儀器的指標中)。間接測量,要按間接測量的函數關系進行誤差合成。測量儀器的誤差范圍指標值因以系統誤差為主,要視其為系統誤差值,按系統誤差處理。
-
(九)關于合成方法的主張
誤差合成,統一按“方根法”。對特定的誤差種類,“方根法”分化為“均方根法”、“方和根法”、“絕對和法”、“混合法”。
通常,測量儀器以系統誤差為主。不能無視系統誤差的存在。考慮到系統誤差、隨機誤差都是客觀存在,提出如下主張:
(1)隨機誤差序列,用“均方根法”,隨機誤差范圍之間,用“方和根法”;
(2)隨機誤差范圍與系統誤差范圍之間,用“方和根法”;
(3)有多項中小系統誤差項,僅有一項大系統誤差(或沒有大系統誤差),它們之間的交叉系數,可能是+1,也可能是-1,有相互抵消、或部分抵消的作用,這樣,可以用“方和根法”。
(4)直接測量僅有兩三項系統誤差,要用“絕對和法”(適用于研制中確定儀器指標);
(5)間接測量,僅有兩三項測量儀器的誤差范圍,要用“絕對和法”;
(6)有多項誤差,在兩項或三項大系統誤差之間用“絕對和法”,其余的各種處理,用“方和根法”。總稱謂是“混合法”。
-
補充內容 (2016-1-30 16:55):
你應該對老史的“相關系數論”駁斥一番,改為 你應該對老史的“交叉系數論”駁斥一番。 |