![]() |
發布時間: 2015-10-26 09:03
正文摘要:本帖最后由 thearchyhigh 于 2015-10-26 09:09 編輯 看了各位對“請仔細看JJF1059.1和1059.2及相關知識再討論不確定度的是非”的回復,我需要回答或說明的點有幾個,我先通過對隨機變量(x+y)與隨機變量x和y的分 ... |
誤差相關肯定是一個相對普遍存在的問題,因為過去總認為誤差有類別,只有隨機誤差之間才有相關性議題(系統誤差連方差都沒有),于是經常是以誤差樣本的子樣本序列來統計其相關性,自然得到的經常是不相關的結論。 現在,不確定度要討論的是總誤差之間的相關性,譬如:用于矩形長寬測量的二把尺子,當涉及面積結果的不確定度評定時,要考慮的是二把尺子各自輸出總誤差之間的相關性。 理論上講,任何二臺儀器,只要它們在溯源鏈上有共同的“祖先”,“祖先”的誤差就同時包含在是他們的輸出總誤差中,這二臺儀器的輸出總誤差就必然存在相關性。譬如:同一廠商生產出來的二把鋼尺,甚至同一國家的二個不同廠商生產的鋼尺等。關鍵是量值溯源體系中“祖先”的誤差通常小小于儀器自身的誤差,儀器之間的誤差相關性通常很弱而可以按忽略來處理。但這仍然是一個理論實踐問題,畢竟強相關的可能是仍然存在的,不可能永遠當忽略處理。而傳統的計量檢測、儀器說明書等通常只給出儀器的標準差而從不提供其和其他儀器的協方差,這對于有多個B類分項的不確定度合成來說當然就是一個困擾。 未來在不確定度理論體系的逐步完善后,計量檢測、儀器制造等領域或也將進行一些操作規范的變革。必須指出的是,誤差之間的相關性是由誤差樣本序列的統計獲得的,誤差樣本的取樣方法當然必須與要討論的相關性相一致。 |
我只能慢慢看,學習學習,佩服各位大神 |
學習了,很好的帖子 |
學習經驗,頂 |
本帖最后由 thearchyhigh 于 2015-10-27 17:51 編輯 史錦順 發表于 2015-10-27 16:13 您說的基本都對,但指出一點嚴重錯誤,一個常識錯誤(大部分人都經常犯,時間問題公式用中文表示了,需要的話改天有時間發個正式貼):--------------------------------- 回家后,東西市稱的大米放在一起。怎樣表達大米的總重量和誤差范圍? 第一種,經典誤差理論。 東西市稱大米,都是只知道誤差范圍。示值不變,可見為未定系統誤差。誤差合成取“絕對和法”。合成誤差范圍是10克。 W1 = 2000克±10克 第二種,不確定度論(包括1980年后的一些誤差理論書籍) 東市用中國秤,西市用日本秤,二者不相關,取“方和根法”。合成誤差范圍是7克。 W1 = 2000克±7克 哪種表達對呢? 考慮各種可能。用不確定度評定的觀點,儀器誤差可設為均勻分布。 易見,經典誤差理論的表達是“上限”表達,對可能有的情況都成立。包含概率是99%。 不確定度論的“均方根法”包含概率約為71%;錯誤概率29%. ---------------------------------------- 不管相不相關,根據常識,結果應該都是2000克±10克,只是結果的概率分布會有點不同,所以可推測用“方和根法”合成的結果也應是2000克±10克,得到7的那是沒考慮到分布情況,當然光推測是沒用的,現證明如下,如果完全不相關時合成過程: 每一個分量分別為5除根號3,得到分量的標準差 合成后為根號下(50/3),約等于4, 然后問題來了,所得4是標準差,算擴展結果,大都會認為是開始除了根號3,現在乘上根號3吧,所以就得到7了, 實際應該是,兩個不相關的均勻分布合成為三角分布(相關的合成還是均勻分布),包含因子為根號6,應該乘上根號6,根號下(50/3*6)=根號下(100),結果為10。 所以要正確應用知識才會有正確的結果。另外,一個概率常識錯誤,即使結果為2000克±7克,錯誤的概率也是10%左右,那是因為把三角分布當均勻分布處理,忽略了左右兩個尖角的面積。可以嚴格計算,因為合成概率是乘法關系,不是加減關系,這兒只給出部分直觀過程,方便大家理解:都大于3.5結果大于7,概率15%*15%=2.25%,同理都小于-3.5小于7,概率2.25%,一部分錯誤概率4.5%。實際應用中95%左右的概率是可行的,所以為了方便,往往不考慮分布,直接當正態分布,取k=2處理,結果為8,錯誤概率5%左右,所造成的影響在允許范圍內。 |
本帖最后由 史錦順 于 2015-10-27 16:14 編輯 - 再論交叉因子 - 史錦順 - 統計理論的相關系數,可以用于對隨機誤差的分析,但不能用來分析有系統誤差存在的情況。而任何測量儀器,都是存在系統誤差的,并且大多數測量儀器的誤差范圍是以系統誤差為主的。因此,對誤差合成的分析,不能完全靠統計理論。 - 測量計量理論中有測得值,還有真值。誤差元等于測得值減真值。 統計學中的統計變量,各個是真值,沒有測得值與真值的差別。對統計測量來說,測得值等于真值,測得值(也就是真值)對應統計理論的隨機變量。隨機變量不能區分測得值與真值,因此,統計理論的某些結論,不能用于誤差分析。用則出現誤導。 統計理論中的相關系數,對隨機誤差分析,可以。 統計理論中的相關系數,對系統誤差分析,不行。 現在不確定度理論引用的統計理論的相關系數公式,分子的基本單元是殘差(測得值減平均值),對系統誤差來說,此基本單元為零。就是說,統計學的相關系數公式對系統誤差的靈敏系數為零。就是說,系統誤差之間有多大的相關性,相關系數也是零。 - 統計理論中,常量的方差為零。 測量學中,測得值可能是常值,即隨機誤差可略;但有系統誤差。 嚴格地說,測量既有系統誤差也有隨機誤差。二者比重可能不同。當一個很大,而另一個很小時,這時就可以忽略很小的那個誤差,而只說很大的的那個誤差。因為二者是“方和根法”合成,故二者的比例是1/3時,忽略的誤差為1/18(5.4%)。 - 當只有系統誤差時,測得值在重復測量中不變,測得值是常值。此時系統誤差為常值。例如某種電子秤,誤差范圍為5克,而隨機誤差小于0.5克,稱重的測得值是一個常值。這是常見的情況。統計理論就描述不了這件事。 在東市,用國產電子秤(誤差范圍是5克,分辨力1克),稱大米1000克。稱5次,示值都是1000克。 表達為: W東= 1000克 ±5克 在西市,用日本產電子秤(誤差范圍是5克,分辨力誤差1克),稱大米1000克。稱5次,示值都是1000克。 表達為: W西= 1000克 ±5克 回家后,東西市稱的大米放在一起。怎樣表達大米的總重量和誤差范圍? 第一種,經典誤差理論。 東西市稱大米,都是只知道誤差范圍。示值不變,可見為未定系統誤差。誤差合成取“絕對和法”。合成誤差范圍是10克。 W1 = 2000克±10克 第二種,不確定度論(包括1980年后的一些誤差理論書籍) 東市用中國秤,西市用日本秤,二者不相關,取“方和根法”。合成誤差范圍是7克。 W1 = 2000克±7克 - 哪種表達對呢? 考慮各種可能。用不確定度評定的觀點,儀器誤差可設為均勻分布。 易見,經典誤差理論的表達是“上限”表達,對可能有的情況都成立。包含概率是99%。 不確定度論的“均方根法”包含概率約為71%;錯誤概率29%. - 有人說:誤差理論就是用統計理論處理誤差問題。這話不準確。在歷史上,是先有誤差理論,后又統計理論。著名的貝塞爾公式,是十九世紀初,貝塞爾為解決天體觀測數據的誤差問題而提出來的。不久后興起的統計理論,移殖了貝塞爾公式,只是把原來的真值,變成數學期望。須知,測量的參考值是真值,因此,研究測量問題,不能照搬統計理論。隨機誤差研究可以用統計理論;但對系統誤差的研究,用統計理論就會出錯。《JJF1059.1-2012》的三條判斷出錯,正是忽略了系統誤差同一般統計變量的不同。系統誤差不能以其平均值為參考,而必須以真值為參考。一般的測量場合,沒有真值,無法實測系統誤差之值,在計量場合有計量標準,有相對真值,可視為真值,便可以實測系統誤差,研究其特性,認識其規律。 - 下面是修改后的《論交叉因子》,其中有系統誤差合成時的交叉因子公式的推導。結論是,對系統誤差來說,“方和根法”回歸為“絕對和法”。 ------------------------------------------------------- - 論交叉因子(修改稿) - 1 理論基礎 函數的改變量,等于函數對各個自變量偏微分的和。就是泰勒展開的一級近似。 f(x,y) = f(xo,yo)+ (?f/?x) (x-xo)+ (?f/?y) (y-yo) (1) f(x,y) - f(xo,yo) =(?f/?x) Δx+ (?f/?y) Δy (2) Δf =(?f/?x)Δx + (?f/?y)Δy (3) 公式(3)是偏差關系的普遍形式。對所研究的特定函數來說,?f/?x、?f/?y是常數。 偏差關系用于測量計量領域,x是測得值,xo是真值, Δx是測得值x的誤差元;y是測得值,yo是真值,Δy是測得值y的誤差元;f(x,y)是求得的函數值, f(xo,yo) 是函數的真值,Δf= f(x,y)-f(xo,yo) 是求得的函數值的誤差元。 - 2 交叉因子的一般表達 設函數的誤差由兩項誤差Δx、Δy引起。由此,函數的兩項誤差元為: Δf(x) = (?f/?x) Δx Δf(y) = (?f/?y) Δy 把分項誤差作用的靈敏系數與該項誤差歸并,記為: Δf(x) =ΔX Δf(y) = ΔY 函數的誤差元式(3)變為: Δf=ΔX +ΔY (4) 對(4)式兩邊平方并求和、平均: (1/N)∑Δf^2=(1/N)∑(ΔX +ΔY)^2 =(1/N)∑ΔX^2 + 2(1/N)∑ΔXΔY+(1/N)∑ΔY^2 (5) (5)式右邊的第一項為σ(X)^2,第三項為σ(Y)^2; (5)式的第二項是交叉項,是我們研究的重點對象。第二項為 2(1/N)∑ΔXΔY =2【(1/N)(∑ΔXΔY) / {√[(1/N)∑ΔX^2]√[(1/N)∑ΔY^2]}】× {√[(1/N)∑ΔX^2]√[(1/N)∑ΔY^2]} = 2J√[(1/N)∑ΔX^2]√[(1/N)∑ΔY^2] (6) (6)式中的J為: J =(1/N)(∑ΔXΔY) / {√[(1/N)∑ΔX^2] √[(1/N)∑ΔY^2]} (7) 稱 J 為交叉因子。 (注:J在此前記為r,稱為相關系數。這和統計理論的相關系數,物理意義不一致。為澄清已有的混淆,本文稱J為交叉因子。) - 3 隨機誤差間合成的交叉因子 記隨機誤差元為 ξ,系統誤差元為 β。 對隨機誤差的合成,ΔX是ξx, 代換為[X-X(平)];ΔY是ξy,代換為[Y-Y(平)],有: J =[1/(N-1)][∑[X-X(平)][(Y-Y(平))] / [σ(X) σ(Y)] (8) 由于ξx、ξy是隨機誤差,可正可負,可大可小,有對稱性與有界性,多次測量,是大量的,因此,隨機誤差間的合成的交叉因子為零(或可以忽略)。(8)式是當前不確定度引用統計理論的相關系數公式。 隨機誤差合成,“方和根法”成立有 σ(f) =√[σ(X)^2+ σ(Y)^2] (9) - 4 隨機誤差與系統誤差合成的交叉因子 兩個分項誤差,一個是隨機的,記為ξ;一個是系統的(重復測量中不變),記為β。 代入公式(7),有 J =(1/N)(∑ξiβ) /{√[(1/N)∑ΔX^2]√[(1/N)∑ΔY^2]} (10) 系統誤差元是常數可以提出來,有 J =(1/N) (β∑ξi) / {√[(1/N)∑ΔX^2]√[(1/N)∑ΔY^2]} (11) 精密測量,要進行多次重復測量取平均值,ξi相當于殘差,殘差之和為零。因此精密測量時,隨機誤差與系統誤差的交叉因子可以忽略,因此,“方和根法”成立。 - 5 系統誤差與系統誤差合成的交叉因子 設(7)式中ΔX為系統誤差βx ,ΔY為系統誤差βy,有 √[(1/N)∑ΔX^2]= |βx| (12) √[(1/N)∑ΔY^2]= |βy| (13) 則系統誤差的交叉因子為 J =(1/N)(∑βxβy) / [|βx| |βy|] (14) =(1/N) (∑βxβy) / [ |βx| |βy| ] =±1 即有 |J|=1 (15) 當βxβy同號時,系統誤差的交叉因子為+1;當βxβy異號時,系統誤差的交叉因子為-1. 當系統誤差的交叉因子為+1時,(5)式為: | Δf | =|βx^2|+2|βx||βy| +|βy|^2 即有 | Δf | =|βx|+|βy| (16) (16)式就是絕對值合成公式。 當系統誤差的交叉因子為-1時,(16)式變為二量差的公式。因為通常只是知道系統誤差之誤差范圍,又鑒于誤差量“上限性”的特點,二量差的公式不能用。 - 6 關于合成方法的主張 通常,測量儀器以系統誤差為主。不能無視系統誤差的存在。考慮到系統誤差、隨機誤差都是客觀存在,提出如下主張: (1) 隨機誤差內部,隨機誤差之間,用“方和根法”; (2) 隨機誤差范圍與系統誤差范圍之間,用“方和根法”; (3) 在兩項或三項大系統誤差之間用“絕對合法” (4) 如果有多項中小系統誤差項,他們之間的交叉系數,可能是+1,也可能是-1,有相互抵消、或部分抵消的作用,這樣,可以用“方和根法”(也可以用“絕對和法”)。 - ------------------------------------------- - 綜上所述,系統誤差在“方和根法”合成時,交叉項中的交叉因子是+1(相關系數為-1的解不能用);這樣,“方和根法”,就回歸為“絕對和法”。 測量儀器的誤差,通常以系統誤差為主。在有系統誤差存在,特別是以系統誤差為主的通常情況下,交叉項中的誤差項,不是弱相關而是強相關(借用常用說法)。這樣,不確定度評定的通常的假設條件“不相關”,實質不是說相關性問題,而是說交叉因子近似為零,交叉項可以忽略,這通常是不成立的。就是說,不確定度評定的“方和根法”是沒道理的。不確定度理論有五大難題:分布規律、不相關假設、變系統為隨機、范圍到方差的往返折騰、求自由度,都是自找麻煩,并無必要;不僅不必要,由于忽略交叉項,不合理地縮小誤差范圍,違背誤差量的上限性特點,成為工程的隱患。 - 須知,不確定度論的五大難題都是為一個目標,那就是推行“方和根法”。 測量儀器通常以系統誤差為主。在以系統誤差為主的通常情況下,“方和根法”是不成立的。“方和根法”這一目標既然被否定,那五大難題也就不存在了。難道這不是皆大歡喜的好事嗎? - 1980年啟動、1993年正式推廣的不確定度論(包括1980年后的一些誤差理論書籍),把系統誤差區分為已定系統誤差和未定系統誤差。說未定系統誤差,與隨機誤差有大致相同的性質,于是可按隨機誤差的處理辦法處理未定系統誤差。又說,已定系統誤差已修正,于是儀器的誤差,包括隨機誤差與未定系統誤差,都可以按“方和根法”處理,就是可以忽略交叉項。 這種混淆隨機誤差與系統誤差性質的認識是不對的;以系統誤差為主的儀器誤差,按“方和根法”合成是錯誤的。系統誤差是客觀存在。否定客觀,否定客觀規律,必然受到懲罰。談論交叉項可忽略的“不相關假設”以及“方和根法”對以系統誤差為主場合的濫用,都是不確定度論破綻的暴露。 - 著眼于“相關不相關”,是說不清交叉項是否可略的問題的。考察的對象必須是交叉因子,而不是相關系性。《JJF1059.1-2012》,本來目的是說協方差(就是交叉項)可忽略的問題。三條都扯到“不相關”的問題上,于是,也就三條全錯了。因為“不相關”與忽略協方差是兩回事。忽略協方差等同于忽略交叉因子,卻不同于忽略相關系數。因此,這三條是誤導。 - |
本帖最后由 njlyx 于 2015-10-27 13:49 編輯 thearchyhigh 發表于 2015-10-27 10:55 接受你“我們就沒必要討論了”的建議。但本人沒有理由接受你的那個“糾正”。 你的那些“推理"在“統計理論”中是比較基礎的內容,本人似乎沒有“看不懂”。 “統計理論”中各種“算法”、概念都有一個根本性的“假定”:它所涉及的“樣本”值都是“真的”,都是所屬“總體”的“真實樣本”;只要“樣本”數量足夠多,就能“統計”出所屬“總體”的真實“特征值”——如“數學期望”的“真值”、“標準偏差”的“真值”、.....。 “測得值”序列顯然是“測得值”這個隨機總體的“真實樣本”,但通常不是“被測量(真)值”那個隨機總體的“真實樣本”,因為總所周知:不可避免的存在“測量誤差”。 如果“測量不確定度”只是關心“測得值”的“散布(寬度)”,不關心“測量誤差”的事,那么, “統計理論”中各種“算法”、概念在此直接應用沒有絲毫問題! 基于rb表達的“相關性”,當然能得到“合成量”的正確“散布(寬度)”。.... 只是,如此“測量不確定度”與“測量工作的‘品質’”能有幾分關聯? |
本帖最后由 thearchyhigh 于 2015-10-27 11:01 編輯 njlyx 發表于 2015-10-27 10:08 RA和RC只有你的文字說明,沒有來源。請先看懂我給的推理過程或者概率論中的推理過程(我在上一貼中有共享概率論第4章),如有問題歡迎指出,如果只是這樣的話,我們就沒必要討論了。糾正你的一句話:“rb描述的是兩個“殘差”量之間的“線性相關性”;應該是”rb描述的是兩個量這間的“線性相關性”,需要通過殘差來計算“ |
本帖最后由 njlyx 于 2015-10-27 10:29 編輯 thearchyhigh 發表于 2015-10-27 09:47 ra描述的是兩個量之間的“線性相關性”; rb描述的是兩個“殘差”量之間的“線性相關性”; rc描述的是兩個“測量誤差”量之間的“線性相關性”。 三者是相通的。rb、rc是ra的具體應用。......你按 "Y=kX"的要求“回歸”【不允許有“b”】試試看?......如果只關心量相對于自身均值的“散布寬度”,那么由rb考慮“相關性”是合適的; 如果要關心量的“最大可能取值”,那便應該由ra考慮“相關性”。 |
285166790 發表于 2015-10-27 09:59 問題的關鍵由于每個人的知識與理解不一樣,所以不同人是不一樣。但你的說法是對的。 |
問題的關鍵還是要對系統誤差進行的必要的修正。比如尺子那個例子,如果帶入了修正值,就不存在明顯相關的系統誤差了,不確定度評定中的相關性問題自然引刃而解。況且校準證書給出數據的原因,就是為了使用它的修正值,不然就和檢定證書使用上沒有區別了。所以帶入修正值必不可少。 |
本帖最后由 njlyx 于 2015-10-26 22:32 編輯 thearchyhigh 發表于 2015-10-26 20:58 前人起名,大致都是比較講究的,就是注重盡量能表達其物理意義或數學關系。兩個量Y與X的“相關系數”就是要表達Y與X的“線性相關”的程度——即:它們的對應序列值{ Y(j)、X(j),j=.....}符合【 Y(j)=k X(j),k不隨j變化】關系的程度。 考察兩個量“殘差”的“線性相關”程度,可得出皮爾蓀的那個相關系數rb —— 【 Y(j)-Ya=k [ X(j)-Xa ],j=1~n, k不隨j變化】? Ya、Xa分別表示 Y(j)、X(j)的均值。 推導梗概:求“誤差平方和”;令“誤差平方和”取極小求出最佳比例系數k;最佳比例系數k下的那個最小“誤差平方和”除以“[Y(j)-Ya]的平方和”,就可導出rb —— rb=±1,對應最小“誤差平方和”為零,線性比例關系【 Y(j)-Ya=k [ X(j)-Xa ],j=1~n, k不隨j變化】完全符合,謂之“完全(線性)相關"; rb=0,則對應最小“誤差平方和”與“[Y(j)-Ya]的平方和”相等,線性比例關系【 Y(j)-Ya=k [ X(j)-Xa ],j=1~n, k不隨j變化】沒有絲毫吻合,謂之“不相關"。 注:“量值序列”的“平方和”通常稱之為該量值序列(“信號”)的“能量”,表達該“量值序列”的整體取值大小。 |
崔偉群 發表于 2015-10-26 14:48 以上一系列問題如果僅僅依靠名詞文字辯說,不會有任何結論?只有通過從數學假設出發,一步一步推導才能得出一個比較靠譜的結論。 我非常認可這句話,所以我才給出了嚴格的數學推理過程,而且文字描述也絕對不以偏概全,推理過程是什么就是什么,不會用這個推理過程去否定其它的東西。 像文中的一句話:“所以,1、可知道相關系數(至少上面內容中的相關系數)是由于有了隨機變量的標準差或方差概念的基礎上才有的,也只有這種相關系數才能代入合成公式,因為這種相關系數是從合成公式中規定出來的。”,通過推理過程已經可以否定“誤差合成的相關系數公式”,但我沒這樣說,只是強調推理中相關系數是這樣的,至于“誤差合成的相關系數公式”請給出推理過程。 另外,您的全文也是文字“描述”吧,特別是(1)和(2)中,有“不一定”字眼的語句,在邏輯學是肯定對的,因為不一定本身包括所有情況“部分是”、“全是”、“不是”。所以盡量不要用類似文字。 |
njlyx 發表于 2015-10-26 14:19 先是要表達什么,不是很明白。個人比較重視某一個概念或參數的物理意義或數學關系,至于叫什么,即然前人或大部分人已經怎么叫了,只要實際意思沒變,就沒必要再“標新立異”。至于史先生,他不認可“相關系數”,所以才叫的“交叉因子”吧。 |
不確定度評論中輸入量的相關性確實是一個爭議比較大的點,從數學上看,有兩個可以肯定并且已經被證明: 1)有數學關系,不一定相關; 2)相關,不一定在現實生活中有關系; 因此,進一步可以臆測 現實生活中有關系,也不一定相關。 關于人們常拿同樣的一把尺子測量正方形的長和寬舉的例子,嚴謹一點,只能說測量有關系,但測量結果不一定相關。 實際上研究相關的問題,首要要回答的是不確定度的兩個輸入量在B類評定中的具有隨機分布的特性是客觀存在的還是人們假設的?如果客觀存在,則在一組測量中,這種隨機特性是被保持的還是拋棄的?如果被保持,是否可以通過測量結果序列估算? 以上一系列問題如果僅僅依靠名詞文字辯說,不會有任何結論?只有通過從數學假設出發,一步一步推導才能得出一個比較靠譜的結論。 以上是個人一點拙見,僅供參考。 |
本帖最后由 njlyx 于 2015-10-26 14:22 編輯 不思考一下:為什么那個系數叫“相關系數”?而沒有叫成別的?諸如史先生說的“交叉因子”?? |
小黑屋|Archiver|計量論壇
( 閩ICP備06005787號-1—304所 )
電話:0592-5613810 QQ:473647 微信:gfjlbbs閩公網安備 35020602000072號
GMT+8, 2025-7-23 03:22
Powered by Discuz! X3.4
Copyright © 2001-2023, Tencent Cloud.