蚋科

[拼音]：fenxi shuju de tongji chuli

[外文]：statistical treatment of analytical data

分析化學測定的全過程都離不開物理量的測量，例如稱量，量體積，讀取電位、吸光度或峰高等訊號值。這些測量技術對於環境溫度、溼度、試劑純度、儀器效能甚至個人的習慣等一系列因素都會在一定程度上產生敏感，從而造成測量資料的波動。實驗誤差是客觀存在的，分析結果必然帶有不確定性。為處理這些波動的資料並恰當地定量描述帶有不確定度的結果，就要用專門研究起伏波動的統計學工具，後者是建立在概率論基礎上的，可以幫助實驗者科學地收集、整理和分析資料，從中獲得資訊，併合理表達資料，以說明研究物件的某些特徵。

誤差

測量值x帶有誤差E，測量值去掉誤差就等於真值μ，μ＝x-E，所以誤差的定義為：E＝x-μ，即測量值偏離真值的程度，也是測量值的不確定度。

絕對誤差

測量值大於真值時誤差為正數，表示結果偏高；反之，誤差為負數時表示結果偏低。這裡的誤差都是絕對誤差，它具有與測量值和真值相對的量綱，也只有在與測量值一同考慮時才有意義。例如，0.05％的絕對誤差，對於大約含矽60％的矽酸鹽中矽的測定是令人滿意的，但是發生在含量僅0.01％的痕量組分分析時，就不容許了。

相對誤差

絕對誤差在真值中所佔的比率稱相對誤差，一般用百分率表示：

當真值為未知時，可用多次重複測定結果的算術平均值塣代替μ。相對誤差是無量綱的，以便於比較不同的分析結果。

粗差

也稱過失誤差，是由於操作誤差而造成的。

系統誤差

它的產生是有一定原因的，系統誤差的大小在相同的測定過程中是恆定的，或者遵循一定的規律變化，例如隨樣品量或試劑用量的大小按比例變化。系統誤差又有一定的指向，例如稱量一種吸溼性物質，稱量誤差總是正值。從系統誤差的來源看，屬於方法和技術問題，知道了產生的原因，便可設法消除或修正，所以也叫可定誤差。

隨機誤差

在相同條件下重複多次測定同一物理量時，誤差的絕對值和符號的變化或大或小，或正或負，看來毫無規律和純屬偶然，這種誤差稱為隨機誤差，也叫偶然誤差。它遵循隨機變數的統計規律，單個地看是無規性的，但就其總體來說，正是由於單個的無規性，才導致了求它們的總和時有正負相消的機會，而且隨著變數個數的增加，誤差平均值趨近於零。這種抵償正是統計規律的表現，所以隨機誤差是可以用概率統計的方法來處理的。

精密度和準確度

誤差代表不確定度，即不精密度和不準確度，但習慣上用其倒數來表示精密度和準確度。精密度高的實驗結果，其準確度不一定高（除非不存在系統誤差）；但精密度高卻是準確度高的先決條件。

精密度純屬隨機誤差引起的不確定度部分，它反映一組重複測定的資料相互接近的程度或說明分散的程度。在分析化學中，根據具體情況的不同，可用以下兩種方式表示精密度：

（1）重複性，是在完全相同條件（同一操作者、同一儀器、同一實驗室和較短的時間間隔）下用相同方法分析相同的樣品所得一組重複測定資料的精密度；

（2）再現性，是不同條件（不同分析人員、不同儀器、不同實驗室、不同時間）下用相同方法分析相同的樣品所得一組測定資料的精密度。

準確度表徵測量值與真值的偏離程度，廣義的準確度應包含系統誤差和隨機誤差的聯合效應。

基礎統計學概念

總體、個體和樣本

統計學中把準備測量的一個滿足指定條件的個體的集合叫做總體，其中的每個單位是一個個體，從總體中隨機抽出的一組個體叫做一個樣本，樣本中個體數目即樣本的大小或樣本容量。對分析化學來說，總體是指在給定條件下經過無限多次重複測定得到的無限多個數據的集合。這隻能是理論性概念，因為實際能夠得到的是有限的N次重複測定的N個測量值，即樣本容量為N的一個樣本，通過樣本的統計量來估計總體的引數。

正態分佈

同一個總體的無限多個數據通常總是聚集在某個中心值周圍。高於或低於中心值的資料對稱分佈在中心值兩旁。距中心值越遠的值出現的頻率越小。若以頻數對測量值作圖，可得圖1

中的鐘形曲線，曲線越寬，在指定條件下測得的資料越分散，精密度也越差，因此以反映分佈曲線寬度的引數σ（曲線拐點到中心值的橫座標值）表徵精密度，同時以反映資料集中趨勢的引數μ表徵總體平均值。確定了μ和σ，分佈就確定了。還可用N(μ，σ2) 表示中心值為μ，分散性引數為σ2的正態分佈。

樣本的統計量

用來估計總體引數。設在指定條件下重複測定一個化學樣品N 次，以x1，x2，…， xN代表N個測定值xi，便可定義下面的樣本統計量為總體引數的估值：

式中

為樣本均值，

為樣本方差，N-1為樣本的自由度。

和

是隨樣本而變化的隨機變數。只有當N趨於∞時，它們才趨近於常數，成為總體均值μ和總體方差捛2。方差的平方根叫做標準偏差捛：

平均值的標準偏差

將一組獨立的重複測定值加以平均時，一部分隨機誤差得到抵償，使平均值帶有的隨機誤差比原測定值為小，N 越大，抵償得越多。平均值的標準偏差σ塣又叫標準誤差，與單次測量值的σ之間的關係為：

故平均值服從

分佈。N增大使σ塣減小的收益，因平方根的關係而有限度。若想使標準偏差減為1/10，便要相應地使N增大100倍，何況系統誤差並不因多次平均而減小，所以通常只在N＜20時才考慮增大N的收益。

不確定度和區間估計

誤差的標準正態分佈

將測量值 x的頻數分佈圖的橫座標改成以標準偏差為單位的誤差，以變數Z表示：

Z是無量綱的，曲線上兩拐點處的橫座標位置分別是－1和＋1，而中心值為0（圖2），

這時的分佈叫標準正態分佈，以N(0，1)表示。

區間估計

圖2中的正態分佈曲線又叫高斯曲線，它根據高斯誤差方程畫出。

式中p(x)dx是一個隨機誤差的值落在區間x到x+dx的概率。整個曲線與橫座標所包的面積代表全部誤差值出現的概率總和，它等於1。樣本值落入任意區間(a，b)的概率記作p(a＜x＜b)，等於x＝a，x＝b線段和曲線組成的面積，即：

經計算，樣本值落入 μ-σ 到μ+σ即 μ±σ區間的概率為68.3％；落入μ±2σ和μ±3σ區間的概率分別為95.4％和99.7％（圖2）。

這裡σ的係數就是N(0，1)分佈中的Z值，若取概率為0.95，即意味著Z＝1.96，各種Z值下的概率可從一般書刊中查到。

容許區間

對總體而言。μ±Zσ 區間內的分佈曲線稱覆蓋域，以P表示，是由Z值規定的。在有限次測定中用樣本值塣和S代替總體引數μ和σ時，由於塣和S是隨樣本而異的隨機變數，致使選定K值組成的塣±KS區間也是隨機的，難以定量覆蓋域。但是如果在選擇P與K的同時外加一個出現這種P值的可能性或概率γ，便能用以下的形式說明問題，例如要回答欲使覆蓋域不小於P的可能性為γ，應取什麼K值。表1給出與常用P和γ 相對應的K值。

由給定P與γ 的K值組成的樣本區間塣±K（P，γ）S叫做統計容許區間。例如，從同一批產品的小包裝中隨機抽樣10個，測定其中某組分的含量，得塣＝15.32％和S＝0.24％，欲以90％的把握估準至少為99％的產品的含量，可以從表1查出γ＝0.90，P＝0.99，N＝10時的K值為3.959，由此計算得到容許區間為 15.32-3.959×0.24到 15.32+3.959×0.24，即14.37％～16.27％。這個答案是：如果產劈a href='http://www.baiven.com/baike/220/260253.html' target='_blank' >分心匙櫸值暮孔袷卣植跡隳芤?0％的把握斷定99％的產品中該組分含量在區間14.37％～16.27％中。

置信區間

已知單次測量值分佈的標準偏差σ，樣本容量為N的測量平均值塣分佈的標準偏差

，則通過塣和不確定度

所組成的區間

能夠括入總體均值μ的概率是由Z值決定的，例如：

這裡的概率叫做置信概率或置信水平、置信度。以一定置信水平估計出的 μ所在的區間叫置信區間。當總體σ為未知而用樣本S 代替 σ確定置信區間時，只有一個置信度就不夠了，而要用一個不但隨置信水平而異的，還要隨自由度f＝N-1變化的因子代替Z。

這個置信因子已由W.S.戈塞特解決了，他把置信因子t定義為：

通過服從正態分佈的樣本去估計總體均值的置信區間為：

t值可從表2查到。必須注意，自由度f＝∞時，各置信概率下的t值即恆等於標準正態分佈中的Z值。

統計檢驗

基本概念

統計檢驗是建立在小概率事件的實際不可能性原理上的概念。分析一個化學樣品和測定某物質的“真實”含量也只能在某種置信水平Pc上用一個置信區間來推斷總體均值的所在範圍。實際上是承認另外那部分小概率1-Pc已小到足以判斷真值不會在置信區間以外。

顯著性檢驗

在實際應用中往往不只是估計總體的值，還需要說明總體的某種性質，例如兩個樣本的差異是否顯著到不能代表同一總體。這裡包括工藝改變後產品質量有無顯著變化，兩種分析方法測定結果是否一致等具體問題。

這類統計推斷都是先提假設，然後按照某種邏輯在某種概率上判斷是否有顯著性差異，以決定原假設的成立與否。所以，統計檢驗方法又叫做顯著性檢驗或假設檢驗。

顯著性水平

顯著性檢驗離不開預設的小概率，例如正態分佈的測量值落到區間 [μ±2σ]以外的概率小於0.05，落到區間[μ±3σ]以外的概率更小於0.01。在N 趨近於∞時，概率如此小的事件在有限次測量中理應不出現。如果竟然出現了，就有理由認為它是異常的。這個小概率越小，相應的事件就越顯得異常，所以此小概率在統計檢驗中叫做顯著性水平α，可用它來反映顯著異常的程度。通常α在0.05以下便認為是顯著。

統計檢驗在分析化學中的應用

（1）極值的取捨，在同一組樣本值中的最大值xmax和最小值xmin叫極值。對極值容易產生懷疑。它的取捨往往很影響精密度。如果技術上找不到捨棄的原因而又有懷疑時，可藉助統計檢驗工具。先假設被檢值不異常，選定顯著性水平α(例如α＝0.05)和一種判據公式，例如格拉布斯檢驗公式：

式中T為格拉布斯臨界值;塣、S、xmax、xmin分別代表均值、標準偏差和被檢驗的極大、極小值。按公式計算 T值與對應於給定樣本容量N 與顯著性水平α 的格拉布斯臨界值T(N，α)（表3）進行比較，如果T＜T(N，α)，則接受原假設，認為不異常，差異隨機波動。如果T≥T(N，α)，則能以不屬同一總體為理由而捨棄被檢驗值，這樣做，犯錯誤的概率小於0.05。

（2）t檢驗，指檢驗兩個樣本容量分別為N1和N2的樣本，看均值塣1和塣2是否有顯著差異，前提是二者的方差相同（只有隨機波動）。

先假設二者在顯著性水平α上無顯著差異，可視為來自同一總體，計算統計量t:

與t分佈表中對應於自由度f＝N1+N2-2的t(1-α，f)值比較，如果t＜t(1-α，f)則接受原假設，即在1-α置信度上認為兩平均值沒有差異。如果t≥t(1-α，f)，則否定原假設，認為兩平均值差異是顯著的，不能只用隨機波動解釋，這樣判斷，犯錯誤的危險率小於α。

參考書目

ASTM， Committee E-11 on Statistical Methods，ASTM Manual on Presentation of Data and Control Chart Analysis，ASTM Special Technical Publication 15D，1976.