胡楠,劉毅,鄒志永,孫銅
(山東省食品藥品檢驗(yàn)研究院,山東 濟(jì)南 250101)
隨著互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、云計(jì)算等技術(shù)的迅猛發(fā)展,當(dāng)今社會(huì)已進(jìn)入大數(shù)據(jù)時(shí)代。數(shù)據(jù)的擴(kuò)張讓我們看到大量從宏觀到微觀、從自然到社會(huì)的觀察,各種計(jì)算機(jī)和檢測儀器設(shè)備都在快速產(chǎn)生海量而多樣化的數(shù)據(jù)。比如實(shí)驗(yàn)室的各種檢驗(yàn)、科研儀器設(shè)備和監(jiān)測、健康裝置以及各種應(yīng)用等,這些都使得科研和檢測領(lǐng)域被推到了一個(gè)前所未有的大數(shù)據(jù)時(shí)代。海量數(shù)據(jù)的劇增,使量變擴(kuò)張引起質(zhì)變,從而引發(fā)人們思維和行為模式的變革。
LIMS系統(tǒng)是計(jì)算機(jī)技術(shù)、數(shù)據(jù)庫技術(shù)、數(shù)據(jù)通信、信息管理、檢驗(yàn)檢測等多學(xué)科集成的實(shí)驗(yàn)室管理系統(tǒng)。通過它可以保證實(shí)驗(yàn)室的質(zhì)量在嚴(yán)格控制下有序地進(jìn)行,從而能使實(shí)驗(yàn)室的檢測結(jié)果符合相關(guān)的質(zhì)量標(biāo)準(zhǔn);同時(shí)LIMS系統(tǒng)提供了各種信息存儲(chǔ)、交換、統(tǒng)計(jì)、分析的網(wǎng)絡(luò)化平臺(tái),可促進(jìn)檢測工作高效、科學(xué)、規(guī)范的管理[2]。隨著信息化的發(fā)展,近些年來大家只關(guān)注系統(tǒng)的使用,出現(xiàn)了“重系統(tǒng)輕數(shù)據(jù)”的問題,對(duì)數(shù)據(jù)的分析利用、深度挖掘重視不足。信息系統(tǒng)僅能滿足業(yè)務(wù)流程電子化需求,這些系統(tǒng)嚴(yán)格意義上說只能算是“數(shù)據(jù)庫”,談不上利用數(shù)據(jù)的內(nèi)在關(guān)系發(fā)現(xiàn)問題,制訂措施對(duì)工作進(jìn)行“管理”,難以滿足領(lǐng)導(dǎo)層的決策需求,信息化的總體效益和效果不盡如人意[3]。
我院已經(jīng)使用LIMS系統(tǒng)7年之久,系統(tǒng)累積了大量數(shù)據(jù),未來信息化建設(shè)關(guān)注系統(tǒng)實(shí)施向關(guān)注數(shù)據(jù)分析方向逐漸轉(zhuǎn)變,利用數(shù)據(jù)處理的成熟技術(shù),實(shí)現(xiàn)基于大數(shù)據(jù)技術(shù)的業(yè)務(wù)智能及數(shù)據(jù)挖掘分析系統(tǒng)的建設(shè),為領(lǐng)導(dǎo)層實(shí)行科學(xué)監(jiān)管和風(fēng)險(xiǎn)預(yù)警提供有效的決策支持。為充分利用我院LIMS系統(tǒng)大數(shù)據(jù),我院從2020年開始,對(duì)藥品檢測數(shù)據(jù)進(jìn)行收集、整合、驗(yàn)證,為日后實(shí)施做好充足準(zhǔn)備,彌補(bǔ)我院在精細(xì)化管理、工作效率提升、流程優(yōu)化、成本控制等方面的不足,為我院帶來的巨大的經(jīng)濟(jì)價(jià)值和社會(huì)價(jià)值。現(xiàn)將我院藥品檢測領(lǐng)域應(yīng)用大數(shù)據(jù)技術(shù)的方法介紹如下。
統(tǒng)計(jì)分析領(lǐng)域內(nèi)常用的工具有R語言、Python語言。R語言主要用于數(shù)據(jù)分析、繪圖以及數(shù)據(jù)挖掘,但也有人用作矩陣計(jì)算。其計(jì)算速度可媲美專用于矩陣計(jì)算的開源軟件GNU Octave和商業(yè)軟件MATLAB[4]。
Python語言同R有重疊之處,同樣支持?jǐn)?shù)據(jù)分析、繪圖、數(shù)據(jù)挖掘等功能。但對(duì)于提升數(shù)據(jù)挖掘與分析來說,Python具有更完整的生態(tài)體系和強(qiáng)大的擴(kuò)展性。
在這里,我們將用到R語言,并結(jié)合兩種技術(shù),完成對(duì)LIMS系統(tǒng)數(shù)據(jù)庫的大數(shù)據(jù)處理[5]。①Greenplum平臺(tái)的PL/R語言,利用Greenplum強(qiáng)大的擴(kuò)展性和SQL友好性,R語言語法和分布式MPP系統(tǒng)的性能優(yōu)勢,完成大數(shù)據(jù)的統(tǒng)計(jì)、分析、挖掘工作;②SparkR,利用Spark分布式計(jì)算集群的強(qiáng)大計(jì)算能力,來運(yùn)行R程序,分析出統(tǒng)計(jì)、挖掘結(jié)果[6]。
2.1 基于客戶提交受理檢品信息、業(yè)務(wù)科受理檢品信息的原始數(shù)據(jù)進(jìn)行分析 ①分析出不同的檢驗(yàn)領(lǐng)域及各類(大小類)的受理檢品總量;②各類檢品送檢數(shù)的同比環(huán)比變化;③各部門科室檢品受理情況:檢品偏離率、檢品分包情況;④各供樣單位每年月送檢品量的變化率及送檢總量,各分包商檢品合格率;⑤各檢品提供商每類檢品合格率,每年檢品要求退樣數(shù),依據(jù)檢品信息可視化查看檢品送檢進(jìn)度(見圖1),各分包商分檢進(jìn)度。

圖1 可視化查看檢品送檢進(jìn)度
2.2 基于檢品送達(dá)原始數(shù)據(jù) ①分析出各檢品供樣單位的檢品送達(dá)率即送達(dá)的檢品與提交的檢品比例,根據(jù)這些數(shù)據(jù)分析出各檢驗(yàn)室檢驗(yàn)進(jìn)度是否超時(shí);②統(tǒng)計(jì)每年承接的檢驗(yàn)任務(wù)數(shù)及檢測進(jìn)度的完成效率;③智能分析出每個(gè)科室檢驗(yàn)數(shù)量其中主檢次數(shù)、協(xié)檢次數(shù)及同比環(huán)比概況,可視化的了解每個(gè)科室的重點(diǎn)工作,任務(wù)量及檢品檢測完成情況。
2.3 利用收費(fèi)確認(rèn)模塊的原始數(shù)據(jù) ①分析出已收費(fèi)及預(yù)授權(quán)量的占比情況;②各科室每年收費(fèi)總額及變化率(見圖2)、各科室的盈利完成進(jìn)度。

圖2 可視化每年收費(fèi)總額及變化率
2.4 基于檢品接收的原始數(shù)據(jù) ①分析出各科室年度工作量;②分析出各科室各檢測員的年度季度月度工作量及檢測完成進(jìn)度一目了然地看出工作人員的工作績效及能力。
2.5 基于結(jié)果錄入的數(shù)據(jù) ①按科室年度統(tǒng)計(jì)超期數(shù)量及超期比率,根據(jù)錄入的結(jié)果(見圖3)推算出各科室每年度的業(yè)務(wù)服務(wù)質(zhì)量及科室任務(wù)完成量;②通過接收檢驗(yàn)整個(gè)過程的數(shù)據(jù)來推算出檢驗(yàn)任務(wù)的完成進(jìn)度;③按檢測結(jié)果統(tǒng)計(jì)各科室及各科室檢測人員檢測結(jié)果的情況,來判斷是檢測過程引起的產(chǎn)品不合格還是檢品本身有問題S系統(tǒng)數(shù)據(jù)庫導(dǎo)出的結(jié)果信息表。

圖3 LIMS系統(tǒng)數(shù)據(jù)庫導(dǎo)出的結(jié)果信息表
2.6 利用報(bào)告書數(shù)據(jù) ①分析出每月每年報(bào)告書初始提交數(shù)量與退回報(bào)告書的數(shù)量;②每年退回報(bào)告書的比例環(huán)比,來推斷出各科室業(yè)務(wù)服務(wù)質(zhì)量;③通過完成的報(bào)告書和已發(fā)送/完成的比例也能夠看出每個(gè)科室的工作量、工作效率、工作質(zhì)量,推斷出是否是要求的時(shí)間段內(nèi)保質(zhì)保量地完成的任務(wù)(見圖4)。

圖4 可視化科室月度工作量
2.7 基于留樣管理中的原始數(shù)據(jù) ①按無留樣、已留樣、未留樣分析本年度或者某年度的數(shù)量;②根據(jù)留樣時(shí)間和收樣日期智能提醒未處理的樣品(見圖5)。

圖5 可視化智能提醒未處理的樣品
2.8 利用檢驗(yàn)管理中的數(shù)據(jù) ①按檢驗(yàn)方法統(tǒng)計(jì)樣品的檢驗(yàn)方式,分析出產(chǎn)品檢驗(yàn)中最常用的檢驗(yàn)方法;②按不同的品種類型分析常用檢測方法;③選擇產(chǎn)品類型智能推薦出常用的檢測方法,提高檢測效率。
2.9 根據(jù)菌種鑒定管理數(shù)據(jù) 智能提醒菌種庫存剩余量,庫存少于一定的數(shù)量用紅色標(biāo)注出來給予提醒。
2.10 基于設(shè)備管理產(chǎn)生的原始數(shù)據(jù) ①統(tǒng)計(jì)每年月儀器維護(hù)、維修次數(shù),通過每年的維修保養(yǎng)的同比環(huán)比情況來推算出機(jī)器能使用的最佳使用年限,為設(shè)備采購報(bào)廢提供數(shù)據(jù)支撐(見圖6);②分析出維護(hù)人員每年維護(hù)的次數(shù)(能發(fā)現(xiàn)某維修人員維修后不容易出現(xiàn)問題耐用),而且能計(jì)算出維修人員的績效(見圖6);③分析出各科室每年每月設(shè)備報(bào)廢情況及報(bào)廢率,對(duì)于報(bào)廢率高的科室要平時(shí)引起注意、重點(diǎn)關(guān)注,看是使用方式不正確導(dǎo)致的還是設(shè)備質(zhì)量問題引起的。

圖6 儀器使用情況及維修人員的績效
2.11 基于LIMS系統(tǒng)檢驗(yàn)財(cái)務(wù)收費(fèi)信息 ①分析出檢驗(yàn)科室檢驗(yàn)收費(fèi)項(xiàng)目、收費(fèi)標(biāo)準(zhǔn),統(tǒng)計(jì)全年檢品分類收費(fèi)情況,結(jié)合檢驗(yàn)工作量以及科室人員配備,根據(jù)統(tǒng)計(jì)結(jié)果,了解客戶檢驗(yàn)需求偏好,提供針對(duì)性服務(wù)[7];②分析上下年度不同檢驗(yàn)分類收費(fèi)波動(dòng)情況,針對(duì)上下年度波動(dòng)較大的分類收費(fèi),結(jié)合政策導(dǎo)向和客戶需求,提出針對(duì)性的解決方案,發(fā)現(xiàn)新的收費(fèi)增長點(diǎn)[8]。
LIMS大數(shù)據(jù)分析系統(tǒng)的可視化環(huán)節(jié)主要是大屏顯示,這也是目前主流的可視化解決方案。大屏幕包括兩個(gè)部分:
3.1 展示區(qū)大屏:實(shí)現(xiàn)檢測信息化的實(shí)時(shí)監(jiān)控,便于送檢客戶更加清楚地了解檢驗(yàn)的完成及進(jìn)展?fàn)顩r。通過大屏幕直觀地看到各種檢驗(yàn)科室的檢驗(yàn)量、辦結(jié)信息等全局情況,實(shí)現(xiàn)信息全面公開展示。
3.2 試驗(yàn)區(qū)大屏:供檢驗(yàn)人員使用,直觀的展示每個(gè)檢驗(yàn)組待檢、待領(lǐng)樣等檢驗(yàn)任務(wù),實(shí)現(xiàn)檢測信息的實(shí)時(shí)通知與消息推送展現(xiàn),便于提升工作效率[9](見圖7)。

圖7 可視化大屏各項(xiàng)任務(wù)一覽
LIMS系統(tǒng)可以保證實(shí)驗(yàn)室的質(zhì)量在嚴(yán)格控制下有序地進(jìn)行,從而能使實(shí)驗(yàn)室的最終產(chǎn)品即所有的檢測數(shù)據(jù)均符合相關(guān)的質(zhì)量標(biāo)準(zhǔn)或規(guī)范,我們可以將大量小數(shù)據(jù)匯總、統(tǒng)計(jì)分析,完成海量信息資源的攫取,從而發(fā)現(xiàn)其中蘊(yùn)含著巨大的經(jīng)濟(jì)價(jià)值和社會(huì)價(jià)值[10]。
將來可以合理利用LIMS使用過程中產(chǎn)生的數(shù)據(jù),并把這些閑散的數(shù)據(jù)統(tǒng)一整合起來,將數(shù)據(jù)變"活"。基于LIMS系統(tǒng)的數(shù)據(jù)進(jìn)行大數(shù)據(jù)分析,形成有價(jià)值的分析結(jié)果,利用這些數(shù)據(jù)使工作管理精細(xì)化、流程規(guī)范化,為決策提供可靠的數(shù)據(jù)支撐。通過可視化的展示能實(shí)時(shí)的查看檢驗(yàn)任務(wù)的進(jìn)度、計(jì)劃實(shí)施進(jìn)度、業(yè)務(wù)服務(wù)質(zhì)量、科室任務(wù)完成量等,從而實(shí)現(xiàn)對(duì)科室的全方位監(jiān)管、對(duì)樣品檢驗(yàn)全方位監(jiān)控。建立大數(shù)據(jù)分析平臺(tái),深入挖掘和分析檢驗(yàn)檢測業(yè)務(wù)數(shù)據(jù),實(shí)時(shí)數(shù)據(jù)統(tǒng)計(jì)和分析、預(yù)測趨勢,提升數(shù)據(jù)應(yīng)用水平,為質(zhì)量分析、風(fēng)險(xiǎn)預(yù)警監(jiān)測、技術(shù)研究、科學(xué)管理等起到支持作用[11]。