卿立銀 季瑞齊 彭洪偉 孫佳雯



摘要:醫院信息系統由有線網絡、無線網絡、傳統數據終端、智能數據終端、基于微型工業控制系統的精密醫療設備組成。規模僅限于醫院內部,并不龐大,但成分卻很復雜,符合大數據技術多數據源、多數據渠道、多數據類型的構造特點,可以作為大數據技術的實驗平臺,推廣使用。醫院信息系統安全屬于新興熱點,適合作為切入層,切入大數據技術。切入分為數據選擇、數據采集,數據傳輸和數據分析四個切入點,其中重點和難點是數據采集技術,即探針程序的開發,要根據不同的平臺選擇不同的開發語言。
關鍵詞:大數據技術;醫院信息系統;信息安全;數據源;數據渠道;數據類型;探針程序;數據分析
中圖分類號: TP311? ? ? ? 文獻標識碼:A
文章編號:1009-3044(2020)35-0025-02
開放科學(資源服務)標識碼(OSID):
1 因為構造的特殊性,大數據技術理論研究多,生產實踐少
大數據技術作為新興的計算機技術,近些年來受到廣泛的關注,網絡安全等級保護2.0標準甚至為大數據技術訂制一套安全指標。但是,該技術僅僅少量投入生產實踐,至今仍然以理論研究為主。究其原因,乃是因為該項技術的特殊性。大數據技術不單強調數據量大,更多的是強調數據多樣化,尤其是在海量數據基礎之上的數據多樣化。數據多樣化和數據量龐大,是大數據技術的兩個基石,缺一不可。如圖1所示。
從內部構成而言,大數據技術又稱“三多一分析技術”。三多指的是多數據源、多數據渠道、多數據類型,一分析指的是統一的分析模型。如圖2所示。
對類似圖書館藏書管理系統這樣的中小型信息系統而言,數據源、數據渠道、數據格式都相對單一,數據量較小,不能形成海量數據,缺乏構成大數據分析技術的基礎條件。而對于銀行核心信息系統這樣的大型信息系統而言,數據源、數據渠道、數據格式多樣,每日有幾億甚至更多的交易量,具備構成大數據分析的基礎條件。但是其核心骨干網絡利用率高達80%以上,通信壓力過大,不能為大數據技術提供足夠的網絡帶寬,需要開辟專門的通信網絡。數據分析模型復雜,運算負荷重,要求配備大量高端服務器才能實現。這要求銀行投入大量財力構建基礎設施,并配備專業的團隊。考慮到成本,銀行高層管理人員容易產生抵觸情緒。大數據分析技術呈現“高不成低不就”的尷尬局面。目前,除了淘寶、京東等電商平臺利用大數據技術分析客戶的購物心理外,在其他信息領域上,大數據技術仍然處在理論研究,未投入實踐。
2 醫院信息領域是大數據技術的良好推廣平臺之一
為了加快信息化速度,推進大數據技術投入生產實踐,筆者結合十幾年醫院信息系統安全經驗,提出在醫院信息系統當中推廣大數據技術的方法。強調一點,醫院信息系統具備推廣大數據技術的天然條件。第一,醫院信息系統包含有線通信設備、無線通信設備、傳統數據終端、智能數據終端、基于微型工業控制系統的精密醫療設備等各式各樣的設備,具備多樣的數據源。第二,醫院信息系統具備無線網、有線網、內網、專網、互聯網等多種通信渠道,具備豐富的數據傳輸網絡。第三,醫院信息系統存儲病人基本信息、病理病例信息、醫藥信息、醫療設備信息、財務信息、后勤保障信息等多樣的數據類型。第四,醫院信息系統的覆蓋面較小,僅限于醫院內部,覆蓋面小,則通信壓力小,可以為大數據技術劃分出專門的通信帶寬,用以傳輸數據。即使通信帶寬不足,也可以購買少量通信設備,緊急擴充,以滿足需要。
綜上所述,醫院信息系統,具備推廣大數據技術的天然的、相對優良的條件,是大數據技術推廣的理想平臺之一。
3 推廣關鍵——探針程序的開發
根據前文陳述,或者從圖3可以看到,醫院信息系統的覆蓋面僅限于醫院內部,數據傳輸方面壓力不大,不是實現瓶頸。實現瓶頸主要來自數據采集,數據采集又稱為數據探針或者探針技術。如何在數據終端中準確無誤地安插探針,采集到完整真實的數據,是大數據技術實現的關鍵之一。
探針是部署在硬件平臺上的一段可執行程序,需要做專門的程序開發。站在探針程序開發的角度,將數據終端分為通用操作系統終端和非通用操作系統終端。PC終端、手機等智能終端、自助服務終端等數據終端,統稱為通用操作系統終端。通用操作系統終端采用的是Windows、Linux等主流操作系統。這些操作系統具備公開的標準的程序開發接口,英文名稱為Application Programming Interface,即API。開發人員可以通過官方API文檔,在操作系統層面調用程序接口,采集數據,并通過網絡傳輸接口將數據放置在網絡中傳輸。高壓氧艙、生化分析儀、氣管鏡、內窺鏡等智能醫療設備,在性質上屬于微型工業控制系統,稱為非通用操作系統終端。非通用操作系統終端,不對外開放開發接口,沒有API可以調用。但是這些終端會通過某一種方式,將數據導出到某一臺PC終端。我們可以將該PC終端作為探針程序的開發對象,調用相應官方API,采集數據并傳輸。探針數據流向圖,如圖4所示。
探針程序所采用的開發語言要根據具體的情況確定。如果數據終端是瀏覽器,開發語言采用JavaScript;數據終端是安卓手機App,開發語言采用Java;數據終端是Windows系列終端,開發語言優先采用C#。開發語言的選擇沒有硬性指標,要根據實際情況選擇適合的語言。
4 最終成果——基于大數據技術的醫院信息系統安全管理中心
功能、性能、安全是信息系統的構成三要素。其中安全是當今熱點和難點,同時又是相對空白點。將大數據技術應用到醫院信息系統安全領域,符合當今形勢。前文中論述數據采集即探針技術和數據渠道的實現方法,下面討論大數據技術的另外兩個方面、數據選擇和數據分析模型。這兩方面內容不必從頭做起,因為目前有非常好的模型可以借鑒,即網絡安全等級保護2.0標準(以下簡稱等保2.0)。數據采集的對象,完全可以全盤借鑒等保2.0的網絡結構、安全計算環境、安全區域邊界等測評對象,針對這些測評對象,從身份鑒別、訪問控制、安全審計、入侵防范、數據備份等安全角度抽取原始安全數據,這樣操作簡單高效。 數據分析模型的關鍵是全網唯一標識符和時間戳。全網唯一標識符可以對每一個安全對象進行標識和有效定位。時間戳標記安全事件發生的時間。標識符和時間戳聯合起來,就可以對安全事件進行二維鎖定。因為醫院信息系統本身規模較小,同時相比銀行、電信、電力、航空等領域信息系統,不容易引起國家級黑客組織的注意,安全壓力不大。所以數據分析模型沒必要太復雜,僅將全網唯一標識符和時間戳關聯起來,針對勒索病毒、DDOS進攻等主流的安全威脅分析確認一下,就足夠了。
在上述論述過程中,忽視了一個細節,就是信息格式變換,采集上來的數據,可能是視頻、音頻、圖片或其他各種各樣格式的數據。要將不同格式的數據轉換成統一的數字或文字格式,需要做專門的數據提取。這種提取技術屬于成熟的技術,請感興趣的讀者查閱相關資料,在此不贅述。
5 理論誕生于實踐,理論還要回歸實踐
大數據理論是非常優秀的理論,是信息技術集大成之作。但不論多么優秀的理論,如果不能付諸實踐,也只是水中月,鏡中花,黃粱一夢而已。廣大科研人員不僅要關注理論創新,同時更要關注理論實現,要將理論融入生產實踐,用理論去指導生產實踐,這樣才能真正促進科技發展和人類進步。
參考文獻:
[1] 馮麗.大數據技術解析及其安全建設研究[J].電腦知識與技術,2019,15(25):13-14.
[2] 張杰宏.醫院信息系統安全現狀及缺陷[J].電腦知識與技術,2019,15(25):15-17.
[3] 馮麗,王彩學,張杰宏,等.基于大數據分析技術的商業銀行信息系統安全預警實施方案[J].電腦知識與技術,2020,16(23):52-53.
【通聯編輯:唐一東】