文/ Stefan Münch,Christian W?lbeling
數據完整性并不屬于新鮮事物——早在20多年前監管機構就提出了這一概念。但在過去的幾年中,數據完整性為何得到了如此多的關注?本文將解釋數據完整性的重要性,闡明相關因素(如風險和實現合規性的控制),并詳細說明數據管治和生命周期管理的方法與意義。
想要定義數據完整性并不容易:美國食品藥品監督管理局(FDA)、美國國家標準與技術研究院(NIST)、電氣和電子工程師協會(IEEE)、英國藥品和醫療保健品監管機構(MHRA)以及其他機構都對數據完整性進行了定義。不過,共同點都是基于ALCOA+ 原則[1]。
如今,制藥行業幾乎所有決策都是基于數據做出的,包括對患者安全和產品質量有直接影響的關鍵因素。手動執行被自動化取代,紙質證據被電子記錄取代。因此,信息或數據在用于重要決策時必須是可信賴的。盡管實現數據完整性不是“火箭科學”,但在過去的5~7年間,FDA的警告信中平均約有50%提到數據完整性問題[2]。
當前,大多數據完整性問題發生在以下方面:
●訪問控制和安全措施(例如,共享用戶登錄名或缺少審核跟蹤);
●未同時錄音;
●未調查數據差異;

操作員在使用維隆PAS-X進行數據管理
●測試合規性;
●對質量至關重要的數據未進行充分地收集、保留或審查;
●原始數據被覆蓋;
●欺詐。
雖然通常不容易找出根本原因,但可以將許多可能影響數據完整性的典型危害歸納為:
●臨時存儲數據導致數據偽造;
●系統接口錯誤導致數據丟失或損壞;
●手動抄錄或數據輸入錯誤;
●不受控制的訪問是未經授權批準的根源;
●軟件或配置錯誤導致處理失敗;
●硬件故障導致數據丟失或數據可用性降低。
對于那些收到警告信或面臨數據完整性問題的公司,其不利影響包括信譽不佳、產品召回,甚至會被排除在利潤豐厚的市場之外。而謹慎處理寶貴數據的公司不僅可以從更好的決策中受益并獲得更多的信任,而且還可以提高自己在新機遇中的市場地位。數據需要數字化,這是未來的發展趨勢。但需要注意的是,數字化是建立在數據之上的,沒有完整性的數據,數據的價值非常有限。
對數據進行創建、更新、共享、存儲、分析和轉換,除了采用人工方式,更多的是通過系統實現。人工智能(AI)在其持續發展的過程中,已經成為了未來生產的“趨勢”,在制藥行業火熱的市場環境下,數據完整性是不可低估的驅動因素。正如默克公司首席執行官Stefan Oschmann所說:“大數據非常關鍵,它將同生物學或化學一樣至關重要。”
考慮到這一點,請想象使用基于錯誤數據的數字孿生或機器學習技術會出現怎樣的結果,以及沒有完整性的數據分析,數據的價值何在。展望未來,使用正確的工具和數據即可掌握自動化決策。越來越多的管理者希望消除所有紙質記錄和混合記錄,因為這些記錄及其在整個保留期內很難一直保持在合規狀態。
因此,《ISPE記錄和數據完整性指南》[3]聲明“數據完整性已得到有據可查的、經過驗證的GxP計算機化系統的支持,并且在整個系統以及數據生命周期中應用適當的控件”也就不足為奇了。此聲明在國際制藥工程協會(ISPE)最新的《通過設計實現數據完整性的良好實踐指南》[4]中得到了進一步解釋:“為了實現數據完整性,必須對計算機系統進行驗證,而每次驗證工作都必須考慮數據完整性要求。”
不管應用程序或計算機系統有多好,某些方面也會超出技術控制范圍的關注:創建和管理數據的人員。換句話說,組織文化(如何處理錯誤)和成熟度是數據完整性實現合規性的驅動因素。每個組織都意識到了這一點,并希望采取有效的控制措施。但是,即使理解了數據完整性的意識和管理,也不能保證完全勝任。僅當公司運用策略并監視執行失敗時,它才能達到最終的成熟度:在不知不覺中不斷進行良好實踐。
為了獲得這種方法的定義和理論基礎,可與能力成熟度模型集成(CMMI)研究所的“數據管理成熟度模型”[5]進行比較。
一個成熟的組織承受的壓力也是巨大的,但他們能夠通過評估各個階段的項目進而從偏差中學習。這些組織通過調查成功地發現根本原因,然后建立問責制和獎勵制。當領導者和主題專家聚集在一起進行決策時,他們將采用“批判性思維”方法。
批判性思維是系統地評定信息的過程,以理性和紀律性的方式進行精確的評估。一個團隊代表各種觀點提出均衡且合理的答案,包括由專家提供數據和情況的有效解釋,同時避免偏見和假設。這種方式考慮了最壞的情況,但并不是排除了可能出現問題的地方;同時明確了數據管治和流程中的差距,從而挑戰控制的有效性。
為了實現全面的數據完整性,需要使用不同類型的控制,包括:
●行為控制(人);
●技術控制(技術);
●程序控制(過程)。
但是,每種策略都有其局限性。盡管數據完整性控制有助于預防和檢測欺詐(實際上是所有數據完整性問題的子集),但即使是最佳系統,也無法準確區分錯誤(即偶然輸入的錯誤數據,如錯字)和欺詐(即有意輸入的錯誤數據)。

在生產現場使用MES
學會應用適當的控制級別,不僅有助于查看系統和流程,而且有助于將重點放在數據上。實現此目的的一種方法是建立良好的數據管治水平。據MHRA稱,數據管治是“確保不管以任何形式生成的數據都能被記錄、處理、保留和使用,以保證記錄貫穿整個數據生命周期”。[6]除了眾所周知的流程和系統所有者外,還為數據所有者和數據管理員引入了新角色。這一新角色負責戰術協調和實現數據完整性以及實施數據使用管理和安全策略。
成功進行數據管治的回報與數據完整性問題恰恰相反:質量提高,缺陷數量減少,召回次數減少,信心增強,以及能夠更好地進行決策制定。在數據管理員的支持下,數據所有者還負責管理數據的生命周期。這是通過設計實現數據完整性的重要方面。實際上,數據在其生命周期中的任何階段都應有指定的所有者。作為基線,應該定義和實施基于風險的強勁業務流程,并理解數據流。此外,應基于受支持的過程對特定的數據生命周期進行定義。這需要考慮到數據可能會在多個系統之間傳輸,而且需要分析與此類傳輸相關的風險。因此,包括在角色之間有效移交數據所有權責任的整體方法都是強制性的。
盡管這聽起來有些雄心勃勃:有人可能會說,數據完整性最終不過是“重新加載合規性”而已。它其實是所有方面的總和,包括詳細程度以及通過設計實現數據完整性的嚴格程度。它的大部分成分是一般可疑項。但是,數據質量及數據完整性的重要程度怎么強調都不過分。
來自美國食品藥品監督管理局(FDA)的Karen Takahashi曾系統地分析過FDA簽發的關于數據完整性的警告信。通過使用柯爾柏的生產執行系統——維隆PAS-X MES中基于ALCOA+的功能,可以十分有效地防止這些問題出現。
舉3個例子,最常見的問題中排名第7的問題是:“貴公司未能在生產時記錄生產和工藝控制功能(21 CFR 221.100-b)。”憑借PAS-X中的操作員執行對話框,可以及時地執行數據錄入和捕獲。如果現場有PAS-X MSI的“即插即用”接口,數據將被自動捕獲。
排名第4的問題是:“貴公司未能保存與每批生產和控制相關的完整信息(21 CFR 211.188)。” 在 PAS-X 中, 這通常由集成的訂單數據管理控制,該數據管理與ERP、LIMS、CAPA以及批處理記錄執行中涉及的其他接口IT系統配合使用。例如,“偏差審核”功能就是根據CPPS和CQAs要求而進行審計追蹤的。
而排名第2的問題是:“貴公司未能對計算機或相關系統進行適當的控制,以確保只有經授權的人員才能對主生產和控制記錄或其他記錄進行更改(21 CFR 211.68-b)。”PAS-X通過預定義的最佳實踐權限與職能內容工作包,嚴格執行與訪問記錄更改相關的用戶管理和流程。PAS-X也支持與無線射頻識別(RFID)卡讀取器或生物特征識別設備相關的特性,從而通過簡化識別用戶訪問過程來加強數據完整性。
總之,使用MES將提高用戶對數據完整性的合規性和工藝流程的理解,因為該工藝將在藥品的整個生命周期中進行結構化和文檔化,并獲得良好的執行和維護。