陳玉華,鄧建明
(1.百色水文中心,廣西 百色 533000;2.貴港水文中心,廣西 貴港 537100)
實驗樣品的管理是實驗室管理的重要環節和關鍵控制點,是保證檢測數據真實、準確、可靠的重要依據,樣品管理的質量直接影響實驗結果的準確性和可靠性,決定著檢驗檢測報告的公正性、客觀性[1]。因此,樣品管理水平是檢驗檢測機構能力認定和實驗室能力認可的重要依據[2,3]。目前實驗室的質量保證主要集中在實驗分析方面,對樣品采集過程關注較少,導致一旦出現誤差而無法溯源其原因。在整個水質監測過程中,采樣誤差是分析誤差的3 倍多,這樣即使降低分析誤差也起不到任何作用。因此,采樣過程很大程度地影響了環境監測數據的質量[4]。
隨著實驗室評審和日常監管的要求越來越規范、嚴謹。樣品管理的科學化、標準化成為評審和評價的重要內容,決定著實驗室能否進入檢驗檢測領域和檢驗檢測數據是否公正、準確。樣品隨機化編碼可以規范樣品采集和分析過程,實現樣品來源信息的不可預測性,減少分析過程的主觀偏倚和均衡未知因素,保證結果可溯源和客觀性,樣品隨機化編碼與電子采集系統相結合可以極大地提高樣品管理效率和質量。
樣品隨機化編碼的應用非常廣泛。例如,在水質評估時,研究人員可能會在多個斷面采集樣品,通過隨機化選擇采樣斷面,可以減少選擇性偏差,確保檢測結果能夠全面反映整個水體的水質;又如,在實驗檢測過程中,研究人員經常使用隨機化分組來分配實驗組和對照組,通過將樣品隨機化分配到不同的組,可以實現樣品檢測基線的一致性,從而降低系統誤差。本文主要介紹利用完全隨機化設計進行樣品編碼的4種方式。
SAS(Statistics Analysis System)是用于數據分析與決策支持的大型規模化的集成應用軟件系統,被譽為國際上的標準分析軟件系統[5],在數據處理與統計分析領域具有重要的地位。SAS具有靈活的功能擴展接口和強大的功能模塊,可以滿足各種不同的需求。尤其在醫藥衛生、金融、生產、教育領域應用廣泛,被用于試驗設計、風險分析、質量控制、抽樣調查和模擬試驗等。本節主要介紹應用SAS的Proc Plan 程序對模擬的12 個水質斷面樣品生成隨機化編碼。樣品名稱和斷面名稱相同為A-L。
SAS程序設計如下:
(1)輸入樣品名稱:

(2)生成隨機數字:

表1 SAS生成的編碼表

在程序基礎上只需要更改樣品名稱,設定種子數就可以重現樣品編碼表或生成新的樣品編碼表,操作簡單方便,生成的編碼表可以溯源,能較好滿足評審要求。
VBA(Visual Basic for Applications)是微軟開發的一種執行自動化任務的宏編程語言。主要用來擴展Microsoft Office 軟件應用程序的功能。利用VBA 編程可簡化復雜工作,減少重復性工作,提高工作效率,實現辦公自動化[6]。
VBA程序設計如下:


表2 VBA生成的編碼表
該程序以隨機抽樣的原理對樣品進行編碼。從樣品集合中隨機抽取樣品,同時將抽到的樣品從集合中刪除,以保證不會重復抽樣,將抽到的樣品按抽中順序從小到大排序,順序號加樣品標識符作為該樣品的編碼。應用該程序時只需要將樣品名稱從A2單元格向下依次輸入,不需要更改代碼,程序運行結束后即可生成樣品編碼表。
Excel 函數法生成隨機化編碼表需要用到3 個函數,分別為Rand、Rank和If函數。Rand函數返回大于等于0 并且小于1 的均勻分布的隨機實數,Rank函數返回數字在排位區域中的次序,IF為條件判斷函數。函數詳細用法請參考函數幫助信息。
Excel函數實現樣品編碼的操作過程如下:
(1)輸入表頭信息:在[A1-D1]單元格依次輸入表頭信息:樣品名稱,隨機數,排位,樣品編碼。
(2)輸入樣品名稱:在[A2-A13]單元格中輸入樣品名稱A-L。
(3)生成隨機數字:[B2]中輸入=rand(),并下拉至[B13]。
(4)生成隨機數字的排位:[C2]中輸入=RANK(B2,$B$1:$B$13),并下拉至[C13]。
(5)生成樣品編碼表:[D2]中輸入=IF(C2<10,"S0"&C2,"S"&C2),并下拉至[D13]。
通過Rand函數生成隨機數,并對隨機數進行排位,排位順序為從大到小,排位數加上樣品標識符作為樣品的編碼。Rand 函數生成的隨機數位數可具體到15 位,因此每次生成的隨機數不相同,隨機數的排位不同,保證了樣品編碼的唯一性。

表3 Excel函數生成的編碼表
隨機數字表也稱為亂序表,是由隨機生成的從0 到9 十個數字組成的表格,表中每個位置上出現某個數字的概率大致相等,它們在表上出現的順序是隨機的。
隨機數字表生成樣品編碼的操作過程如下:
(1)確定要讀取數據的位數。本實驗共需12個編碼,因此,讀取兩位作為一個隨機數字。
(2)確定讀取的起點和順序。可以從隨機表[7]的任一行任一列任意順序讀取,如第6行第7列,從左向右讀取。依次讀取2位數字作為一個隨機數錄于樣品名稱下方。
(3)將全部隨機數從小到大編序號(數據相同的按先后順序編號),將每個隨機數對應的排序號記在第三行。
(4)序號加上樣品標識符作為樣品的編碼。

表4 隨機數字表生成的編碼表
隨機數字表法生成樣品編碼的原理與函數法相同,均以生成的隨機數的排序號作為樣品的編碼依據,不同之處是隨機數字表法可以通過隨機數字表重現樣品編碼,而函數法只能生成新的樣品編碼。
樣品的規范化管理既體現了實驗室的檢驗檢測能力也體現了實驗室的管理水平,同時也是實驗室質量體系順暢運行的重要保障。在檢測機構資質認定和外部監管越發趨嚴的形勢下,樣品的數字化、精細化管理對提升實驗室運行效率,滿足審評要求起著重要的作用。通過規范樣品采集和分析過程,在樣品采集前生成樣品編碼表,按照樣品編碼表到對應斷面采集樣品,樣品分析時按照樣品編碼順序依次進樣檢測,可以較好地保證樣品采集和分析過程的規范性、溯源性,同時樣品采集和分析過程對檢測人員設肓,可以降低檢測風險,保證分析結果的客觀性、準確性和可靠性。
四種編碼方式各有優缺點。SAS 專業性強,功能強大,結果可溯源,不足之處是SAS 需要購買許可證才能使用相應的模塊。Excel VBA 易于理解和操作,可以和其他Excel 功能相結合實現靈活的操作,不足之處是Excel VBA的算法不夠豐富和精細。函數法是最為簡單的一種編碼方式,但只能生成新的編碼表而不能再現已經生成的編碼表。隨機數字表應用時間早,應用范圍廣泛,例如應用于臨床試驗、調查研究等。不足之處是生成的隨機數字受表格大小的限制,不適合于生成大量的隨機數字,同時隨機數字表的質量取決于生成的隨機數字的質量,樣品編碼需要手動操作,制表效率較低。文中設計的四種方式,均可以實現對水質樣品的編碼管理,檢測機構可以根據樣品量、工作需求、財務能力選取一種適宜的編碼方式高效、規范地實現對樣品的加密設盲管理。