EstherShein


編譯 charles
當卡羅來納醫療衛生系統(CHS,Carolinas HealthCare System)的腫瘤學家在腫瘤委員會進行審查前就討論患者病例時,說明他們正在尋求有關治療計劃和臨床試驗的反饋。這些醫生在討論過程中觀看了同事們的基因數據、病理報告、實驗室結果和醫生的筆記——所有內容展示都是通過指尖點擊就完成了,因為這些都存儲在微軟Azure的Hadoop云中。
這是非盈利性醫院網絡第一次革命性的進入云計算,這也促使CHS認真仔細的考慮如何保護和管理位于醫院外部的數據。
對此,CHS信息和分析服務(IAS)副總裁Chris Danzi認為,CHS要處理好的兩大問題是網絡和治理問題。這家醫院擁有員工62000多人,在東南亞經營39家醫院和900家其他醫療機構。
對內部和外部數據進行管理,其明顯區別是在云端,數據可能會在數百英里之外。Danzi指出:“您要考慮的是遠程移動數據,因此您必須建立一條電路,通過安全的網絡進行連接。”每天晚上將數千兆的數據傳輸到云提供商那里,這就要求醫院與電信運營商簽訂合同,購買安全的醫療網絡專線。
卡羅來納醫療衛生系統
CHS信息和分析服務副總裁Chris Danzi認為,卡羅萊納醫療衛生系統要處理好的兩大問題是網絡和治理問題。
在數據遷移到云端的一年中,CHS一直在使用VPN——即將要被替換為與Azure的私有連接。這樣,醫院網絡也可以將該線路用于其Office 365系統。
Danzi解釋說:“還必須要考慮的是,我購買這條線路不僅是為了獲得更好的速度,還得支持用戶實時訪問網絡進行交互,同時我還要大批量的傳輸文件。”
他說,在云中管理數據不同于在內部管理數據,這需要技術高超的員工,還需要考慮如何制定數據治理計劃以及怎樣啟用一些技術基礎架構。
Danzi說:“如果站在那些試圖竊取您數據的人的角度來看,必須重新考慮這些方面。我們內部部署得已經很好了,但現在我們要把數據傳輸到不同的地方,并將其存儲在那里,所以我們必須得重新思考。而且是不斷的重新思考。因為每天我們都會聽到出現了一些更為聰明的竊取數據的新方法。但這是值得的。”
更多公司選擇了在外部存儲數據
毫無疑問,云已成為許多企業的IT和數據環境不可或缺的組成。IDC數據集成軟件研究總監Stewart Bond說,最近的IDC調查顯示,越來越多的企業正在將數據整合到混合云和僅云環境中,而不是將數據完全保留在內部。
Bond說,云中的數據可以是在軟件即服務(SaaS)應用程序中,在平臺即服務(PaaS)系統中,或者包含在基礎設施即服務(IaaS)中實現的數據庫和文件服務器中。在SaaS應用程序中訪問數據通常需要使用API。他解釋說,使用Web服務訪問數據與使用SQL腳本訪問關系型應用數據庫完全不同。
Bond說:“在PaaS環境中,具體實現將決定是否需要Web服務API,SQL和NoSQL方法能否用于訪問數據。”可以使用編程結構來訪問IaaS環境中的數據,這種結構也適用于內部部署的數據源,但應在安全通信通道中進行這些訪問。在任何情況下,主數據管理技術都有助于協調多個不同的數據孤島。
技術業務管理(TBM)理事會的新任總裁Erez Yarkoni回應Danzi說,在考慮如何管理云數據的步驟時,首先也最重要的是,企業應非常仔細地規劃網絡容量。
曾擔任Telstra和T-Mobile首席信息官的Yarkoni說:“當數據中心的數據保存完好時,以前我們理所當然地認為一些事情正在發生變化,您在擴展網絡規模時必須非常小心的進行設計。他說:“這又增加了另外一個因素——如果您不仔細地規劃出入口環境,和云本身的交互,以及人們如何與您放入云中的信息進行交互,那么您的成本可能會非常高。”
Yarkoni說,當他是首席信息官并參與設計數據環境時,他盡可能避免將大量數據傳輸到云端,如果非要這樣做,那就在一天的某些時段進行。如果您把信息從數據中心移動到云端,并要求獲得一些服務質量保證,那您必須確保這些位置之間的鏈接是可靠的。
檢查云供應商
Forrester公司副總裁兼首席分析師Andras Cser說,雖然企業通常會對云提供商進行審核,但這一過程往往進行不下去。他說:“我們看到大多數企業會對云計算提供商進行初步審核,然后才會決定是否把數據存放在他們那里。但很少會把審核持續下去。”這可能是由于要處理其他更優先的事務、流程過于復雜、云中存儲的數據量以及要加快推進云應用等原因造成的。
而Forrester看到公司一般都會要求ISO27001和SOC1/SOC2認證。
在這方面,CHS則規定其云提供商通過了SOC 2審核,并且可以提供審核結果。CHS的Danzi說,CHS可以審核他們與計費方法相關的記錄。做好通知后,也允許CHS檢查其供應商的數據中心。他說:“一般去他們那里參觀一下就可以了。”
他說,像微軟面向Azure的ExpressRoute和Amazon的Direct Connect這樣的產品會在內部部署環境和各自的云端之間提供專用網絡連接。
咨詢公司全球數據戰略有限公司信息管理總經理Donna Burbank說,一旦數據在云中,IT部門就不再需要數據庫管理工具來管理數據庫,因為管理數據庫性能、優化和設置等耗時的過程都交給云提供商去處理了。
她指出:“您了解你的數據,并知道它在哪里,也知道保護數據的重要性,但很多日常管理工作已經不需要了。”云提供商現在管理性能和優化等任務,檢查服務器是否正常工作,并進行了備份。
保護云數據
Burbank指出,管理云中的數據不同于在內部管理數據,特別是在處理客戶相關信息等敏感數據時。當其他實體控制個人信息時,她建議使用PCI數據安全標準和令牌密鑰。當公司要發揮云的效率時,她說:“有很多信任都是假設的,您并沒有完全控制它。”
Forrester高級分析師Heidi Shey同意Burbank的意見,即安全令牌是保護數據的一種方式,但她認為,企業應該規定誰掌握這些令牌。她說:“一些安全解決方案把加密作為一種控制手段,但誰擁有密鑰是個問題。有些公司希望自己控制,而有的公司則會相信供應商。”
控制自己的密鑰是最好的選擇。Shey說:“這樣做有時會讓事情更復雜,因為您要管理它,要進行額外的控制。”
Bond說,不但要保證云端數據的安全,確保數據在傳輸過程中的安全也很重要。他說,這需要VPN連接、HTTPS、SFTP/FTPS和其他安全的通信方式。
他說:“IDC的調查還表明,分布在云中的數據越來越多,信任也越來越困難。主數據,特別是有關企業核心人員、地點和事物的數據是最分散的,因為每個應用程序都需要訪問這些數據。”
然而,在2017年1月份的Forrester調查中,通過對美國和加拿大的150位數據安全專業人員的調查,只有31%的受訪者會根據數據的敏感程度對云中的企業數據進行分類。此外,調查發現,只有大約三分之一(34%)的數據安全專業人員知道他們云中的企業數據位于何處。
Forrester的Shey說,還必須考慮云安全治理流程,企業安全要求還必須符合合規性和隱私法律要求,特別是涉及個人信息時。
由于是醫療衛生實體,CHS發現云中的安全管理更加復雜。CHS的Danzi解釋說,人們在云中使用的大量Hadoop環境并不比結構化關系型數據庫環境成熟。CHS正在使用Apache Hadoop的HDInsight,該公司提供Apache Ranger等產品,屬于管理用戶級訪問的Enterprise Hadoop的安全層。
微軟Azure支持兩個版本的Hadoop實現——完全管理的HDInsight版本,還不支持Ranger,還有IaaS版本HDP,但是這一版本支持。HDInsight符合HIPAA標準,Danzi解釋說:“但沒有Ranger的深度用戶級安全特性,所以我們必須限制訪問。”這是CHS之前得到的重要教訓:要確保云供應商支持公司正在使用或者希望使用的軟件版本。
他說:“您不要想當然地認為他們會提供您習慣使用的所有安全協議和保護措施。好在有人提出了這個問題,這是一個教訓。而且,針對誰可以被授權訪問,我們使用的Hadoop版本了采用‘all or nothing策略。”但CHS只希望其信息和分析服務(IAS)管理員能夠訪問其環境。因此,該公司在Microsoft SharePoint中開發了一個安全應用程序,僅向腫瘤科室的醫生提供患者的信息。
Shey補充說,云中管理數據的另一重要因素是數據駐留和數據傳輸。她說:“如果您有來自某一國家或者地區客戶人員數據...您要遵守‘一般數據保護條例,但具體國家可能有自己的數據駐留要求,他們希望您把數據保存在自己的國家中。”
全球數據戰略公司的Burbank表示同意:“您應該知道數據實際存放在哪里,因為不同的國家有不同的法律。歐洲關于保護個人客戶信息的規定比美國更嚴格。”
其他云管理考慮
Burbank說,云供應商的服務等級協議中應闡述清楚數據備份和恢復,這是他們應該提供的關鍵優勢之一。這些服務等級協議應包括供應商是否提供故障恢復站點以及該站點所在位置等信息。她說:“另外還要考慮您能不能選擇這些故障恢復點所在位置。”
企業還應該考慮他們在云中以什么樣的形式管理數據;可以在關系型數據庫中,在無格式文件或者電子郵件中。Burbank說,如果他們把客戶數據存儲在大容量數據倉庫中,他們還應考慮他們是否擁有在內部管理數據的能力。
Burbank指出:“如果您針對數據進行大量的清理和管理工作,那么這是需要考慮的事情,畢竟很多云技術還不是那么先進。但是,如果您的原始數據很容易進行擴展和遷移,那么這就非常適合于云端,因為它不需要很多管理。”
由于技術如此之新,還很難找到管理云中數據所需的技能。IDC的Bond說,所需的技能取決于數據是在SaaS、PaaS還是在IaaS模型中。在技術層面上,IT人員應熟悉互聯網技術,例如,Web服務、SSL、安全FTP和RESTful API等。他們還可能要熟悉IaaS體系結構,如虛擬機、對象存儲、可用區域和子網絡。
Bond補充說:“在業務層面,用戶應清楚管理數據輸入和維護的政策,以及跨多個系統進行數據復制的延遲問題。”
應對好意外事件
CHS的Danzi把云環境與高爾夫大師賽做了一個比較:一個網站在一年中幾乎有10個月都沒人訪問,然后會有一個月突然有大量的訪問。同樣地,他們發現CHS的一些“熱情洋溢的數據科學家”剛剛開始運行R編程語言,編寫模型來研究病人二次入院的風險。運行這些模型很費錢,云能夠很好的提供所需的資源,運行的也非常好。
因此,在Azure的幫助下,IAS小組撰寫了腳本,晚上不需要計算時關閉模型。Danzi說:“云就像一個被吹大的氣球,你必須告訴它讓空氣放出來,它才能讓您編寫腳本關閉服務器。這就是所謂的彈性,您應確定云供應商也能讓您在云中有彈性,這樣,只有在您使用資源的時候才付費。”
他還建議受監管的企業聘用一些熟悉法律的人員。您必須確保您的所有HIPAA合規,與第三方服務提供商建立了良好的業務協作協議。
許多云供應商提供分析產品,并為潛在客戶提供基準分析,所以Danzi說,您要確保這些供應商在將您的數據提供給行業的同行時,對數據進行匿名化處理,使其看不出數據是來自哪里。
他說,企業可能沒有考慮到的另一個問題是,如果他們在Azure上編寫算法,他們應該保護該算法的知識產權,以免其他人在云中使用它。“您使用任何人都觸手可及的常用工具和常見的基于云的技術來開發算法,因此您應該把知識產權保護好。”
Danzi相信,所有數據將在15年內實現在云端的托管。雖然管理云數據時需要大量的額外工作,但他說這是值得的。“雖然在新環境中應一直保持警惕,但付出總會有回報,因為您可以使用這種絕對令人驚奇的技術,這一技術會隨著您的發展而擴展,當您不使用它時,它可以‘收縮,讓您擁有所有這些高級功能。”
Esther Shein——特約撰稿人
Esther Shein是《計算機世界》的特約撰稿人,是一位記者,他專注于商業和技術以及教育等普遍感興趣的領域,在這些領域中,他在書面出版和網絡媒體上都有豐富的撰稿和編輯經驗。
原文網址:http://www.computerworld.com/article/3185405/expert-tips-for-managing-your-cloud-data.html