999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

大數據分析及其在醫療領域中的應用

2014-07-01 22:21:21鄒北驥
計算機教育 2014年7期
關鍵詞:物聯網大數據

鄒北驥

摘要:互聯網和物聯網技術的快速發展給數據的上傳與下載帶來了前所未有的便利,使得互聯網上的數據量急劇增長,由此產生了針對大數據的存儲、計算、分析、處理等新問題,尤其是對大數據的挖掘。文章分析當前大數據產生的背景,闡述大數據的基本特征及其應用,結合醫療領域,論述醫療大數據分析的目的、意義和主要方法。

關鍵詞:大數據;物聯網;醫療;大數據挖掘

1 大數據早已存在,為何現在稱之為大數據時代

計算與數據是一對孿生姐妹,計算需要數據,數據通過計算產生新的價值。數據是客觀事物的定量表達,來自于客觀世界并早已存在。例如,半個世紀前,全球的人口數量就有數十億,與之相關的數據就是大數據;但是在那個時代,由于技術的局限性,大數據的采集、存儲和處理還難以實現。

互聯網時代之前,采集世界各地的數據并讓它們快速地進入計算系統幾乎是一件不可想象的事情。20世紀80年代興起的互聯網技術在近30年里發生了翻天覆地的變化,徹底地改變了人們的工作和生活方式。通過互聯網人們不僅可以下載到新聞、小說、論文等各類文字數據,而且可以輕而易舉地下載到音樂、圖像和視頻等多媒體數據,這使得互聯網上的數據流量急劇增長。據統計,現在互聯網上每分鐘流入流出的數據量達到1000 PB,即10億GB。

推動大數據產生的另一個重要因素是物聯網技術。近幾年發展起來的物聯網技術通過給每個物品貼上標簽并應用RFID等技術實現了各類物品信息的快速采集。如新研發的各種穿戴式設備可實時在線獲取人體運動過程中的各種數據,各類帶有USB接口或網絡接口的電子儀器可迅速地將儀器中的數據上傳到互聯網并進入計算系統,智能化生產過程中產生的各種數據、GPS導航系統和飛機汽車等現代交通工具在行進中產生的數據均可通過移動互聯網上傳。所有這一切表明,由于互聯網技術的發展和物聯網技術的推動,使得原本存在的大數據可快速地進入到計算系統,大數據時代到來了。

大數據的產生也與其他領域的技術發展密不可分。如生物遺傳學領域近幾年開展的一項巨大工程——人類基因組計劃,要對人類23對染色體基因中30億個堿基對進行測序,其數據量之巨大,以至于當前高性能計算機系統都難以在可接受的時間內完成。高能物理實驗一天產生的數據高達幾個TB,這些數據都在排隊等待處理,當前的計算系統已難以滿足它們的處理要求了。

人們關注大數據的最重要原因是因為大數據中隱藏著具有豐富價值的信息。互聯網上傳遞的商品訂購信息反映了消費者的意向、對商品質量的評價等,于是不斷地收集互聯網上的這些信息并進行挖掘分析將有助于企業分析其產品前景,從而不斷改進以獲得更多利潤。分布在全球各地的氣象設備采集的氣象數據通過互聯網匯集并通過挖掘分析后可用于預測天氣情況,來自世界各地的地震監控儀采集的大量地下數據通過互聯網收集形成大數據,采用數據挖掘方法分析并預測地震。大數據最早應用于電子商務領域,美國亞馬遜公司的電子商務平臺每天獲得大量的客戶訂單和消費數據,應用機器學習和數據挖掘方法分析這些數據,發現了商品銷售中的關聯性,如商品A和商品B經常被客戶同時購買,于是有意識地將這兩種商品(也許它們是毫不相干的兩類商品)擺在同一個貨架上,使得商品的銷售量大增。這就是典型的大數據分析的結果。因此大數據時代我們所要做的事情就是對隱藏于大數據中有價值的信息進行分析與挖掘,以便利用它們為人類服務。

2 大數據的特征與計算系統面臨的新問題

來自于各個領域的大數據盡管代表著不同的事物,隱藏著不同的價值信息,但都具備4個重要特征,稱為4V特征,即Volume(大容量)、Velocity(快速更新)、Variety(多類型)和Value(高價值)。所謂Volume是指數據量極大,雖然沒有一個絕對的容量標準,但一般都在數十個TB以上。Velocity是指數據產生和更新的速度很快,大數據的產生是一個快速的動態過程。Variety是指數據的種類多,除了文字數據外,還包括圖像、圖形、視頻以及聲音等多媒體數據。Value是指大數據中隱藏了具有高價值的信息,這些信息需要通過機器學習與數據挖掘方法才可能提取到。以醫院電子病歷數據為例,它是典型的大數據。首先,電子病歷的數據量大。以一個小規模城市的數家醫院形成的區域醫療系統為例,每大門診量和住院病人人數都在數萬人以上,每人每次的病歷、檢驗數據可達到幾個GB,因此每天的數據都在幾個TB甚至數十個TB以上。其次,數據的更新速度快。每天在線檢查化驗的人數快速增加,其數據也在快速更新。第三,電子病歷的數據類型包括了文本、圖像、圖形和視頻等多類型數據。最重要的是電子病歷數據中隱藏著極有價值的醫療和醫學信息。通過數據挖掘方法可以挖掘出這些信息以便醫生進一步分析患者的病因,形成更好的治療方案。

大數據給計算機科學與技術領域帶來了以下的新問題和挑戰。

(1)大數據的存儲。大數據一般來自互聯網,是動態的多類型數據。盡管當前的存儲器容量在不斷增加,但選擇一種什么樣的結構來存儲大數據以便能更好地存取是一個需要解決的問題。以電子病歷數據為例,多家醫院產生的電子病歷數據是集中存儲于某一個醫院還是分布式存儲于各家醫院,這里不僅有一個管理、隱私和醫院利益的問題,也有技術上實現的問題,有待進一步研究。近幾年發展起來的云存儲或許是一種很好的選擇。借助于第三方提供的云存儲服務,在保證數據安全和各個醫院權益的條件下,各家醫院可以將自己的電子病歷數據存儲到云服務器上,實現數據共享。

(2)計算系統的結構和計算模式。傳統的單機系統和分布式系統難以處理這些動態實時更新的大數據,于是以集群方式構建的多機系統再加上以互聯網相連的云計算平臺將成為大數據的有效計算平臺。分布在各地的數據需要由當地的集群式計算平臺對數據做預處理,然后通過互聯網將數據傳輸到數據處理中心,以更高性能的集群式系統進行處理并將結果反饋到各個分布式系統中。近幾年美國Google、IBM公司還有中國的曙光、聯想等大公司相繼推出了用于處理大數據的各種集群式計算機系統,它們可為大數據的處理提供更好的服務。endprint

猜你喜歡
物聯網大數據
基于物聯網的煤礦智能倉儲與物流運輸管理系統設計與應用
基于高職院校物聯網技術應用人才培養的思考分析
基于LABVIEW的溫室管理系統的研究與設計
論智能油田的發展趨勢及必要性
大數據環境下基于移動客戶端的傳統媒體轉型思路
新聞世界(2016年10期)2016-10-11 20:13:53
基于大數據背景下的智慧城市建設研究
科技視界(2016年20期)2016-09-29 10:53:22
數據+輿情:南方報業創新轉型提高服務能力的探索
中國記者(2016年6期)2016-08-26 12:36:20
中國或成“物聯網”領軍者
環球時報(2016-08-01)2016-08-01 07:04:45
主站蜘蛛池模板: 98超碰在线观看| 亚洲全网成人资源在线观看| 美女裸体18禁网站| 日韩在线欧美在线| 国产在线视频导航| 日本成人一区| 国产午夜人做人免费视频| 日韩色图区| 国产你懂得| 狠狠干综合| 亚洲毛片网站| 欧美精品成人| 毛片在线播放网址| 国产成人毛片| 国外欧美一区另类中文字幕| 色窝窝免费一区二区三区| 性视频一区| 中文字幕无码电影| 91精品国产自产在线老师啪l| 一本大道AV人久久综合| 国产精品成人免费综合| 国产一区在线观看无码| 67194亚洲无码| 久久久亚洲国产美女国产盗摄| 1769国产精品免费视频| 亚卅精品无码久久毛片乌克兰 | 青青青亚洲精品国产| 91精品在线视频观看| 97免费在线观看视频| 午夜不卡视频| 欧美日韩亚洲综合在线观看| 午夜成人在线视频| 亚洲欧洲一区二区三区| 97精品国产高清久久久久蜜芽| 97se亚洲| 亚洲国产成人麻豆精品| 72种姿势欧美久久久久大黄蕉| 国产精品网址在线观看你懂的| 72种姿势欧美久久久久大黄蕉| 一级看片免费视频| 国产一区二区三区夜色 | 中文字幕在线不卡视频| 91国内在线观看| 免费观看欧美性一级| 婷婷色中文| 亚洲性日韩精品一区二区| 在线观看国产黄色| 丁香综合在线| 欧美97色| 国产麻豆aⅴ精品无码| 国产农村1级毛片| 国内精品九九久久久精品| 久久国产精品夜色| 国内精自线i品一区202| 女人18毛片久久| 啊嗯不日本网站| 在线观看av永久| 国产一区二区人大臿蕉香蕉| 高清国产va日韩亚洲免费午夜电影| 欧美19综合中文字幕| 精品小视频在线观看| 国产成人免费高清AⅤ| 国产成人亚洲精品蜜芽影院| 久久精品丝袜| 国产精品欧美亚洲韩国日本不卡| 成人福利在线视频| 老司国产精品视频91| 久久国产亚洲偷自| 国产精品久久久久久久伊一| 香蕉网久久| 免费A∨中文乱码专区| 91福利在线看| 在线日韩一区二区| 99久久精品无码专区免费| 久久综合色播五月男人的天堂| 国产欧美精品一区aⅴ影院| 99热这里只有精品免费| 日韩精品专区免费无码aⅴ | 国产一级一级毛片永久| 精品一区二区三区自慰喷水| 亚洲精品另类| 亚洲国产中文在线二区三区免|