王平泉 逯小青
摘 要 大數據時代,谷歌利用人們在網上的幾十億條檢索記錄預測冬季流感的傳播,其預測結果與官方數據的相似性高達97%,更重要的是谷歌通過分析大數據預測要比官方給出的結果早2周,顯然,谷歌大數據預測更有效、更有價值。沃爾瑪由其購物清單的龐大的數據庫中發現颶風用品和蛋撻的相關性,在季節性風暴來臨時,把蛋撻放在靠近颶風用品的位置,這一舉措極大地提高了兩者的銷量。而這依然是得益于沃爾瑪對于大數據的分析和處理。大數據帶來的巨大價值正漸漸被人們認知,為人們提供了一種全新的看待世界的角度。因此,我們研究面向大數據的信息系統服務建模與活動認知。
關鍵詞 大數據 信息系統 構建
中圖分類號:TP393 文獻標識碼:A
互聯網時代,設備互連,資源共享,UGC帶來大數據。UGC是一種提倡個性化的使用互聯網的新方式,它允許用戶將自己原創的內容通過互聯網平臺進行展示或者提供給其他用戶,比如人們可以通過YouTube 網站分享一段家里萌寵的可愛視頻,可以在博客上發表對于家庭生活,人際關系乃至國家大事的看法,可以在facebook上面發表時時刻刻的心情,與朋友保持互動等等。因此,除了傳統的信息系統提供的數據,twitter、facebook、微博等信息社交網絡應用的涌現,海量用戶原創的內容帶來了更大量的數據;移動互聯網時代,隨著移動智能設備的普遍應用,人們可以隨時隨地的進行信息傳遞和共享,用戶行為進一步帶來了大數據。當前,智能終端(智能手機、PAD、平板電腦、MID等)已經滲透到大眾的生活當中,移動設備的普及正逐漸改變了人們的生活方式,激發出更多的移動互聯網用戶行為。人們更愿意讓移動設備參與日常生活,運用手機上的應用和家人保持聯系,動動手指就可以上網購物,這些用戶行為產生的數據量將成幾何性的增長;物聯網時代,物理世界融入信息空間,十億計的設備和物理環境帶來的海量數據更是難以估量。物聯網技術使得普通物理對象進入了信息網絡,從而無限的延伸了互聯網。在物聯網中,數十億的設備互通互聯,產生數萬億的連接節點,物聯網與云化的數據中心無縫整合在一起,產生以指數速度飛速膨脹的數十萬億GB的海量數據。在物聯網中,由于更多的、混雜的以及關聯度低的信息抽象為各種具有實際應用意義的用戶服務,因此對信息系統的服務建模具有重要意義。
本文以物聯網領域的信息系統為對象,研究信息系統服務建模與活動認知。為了建立有效的信息系統服務模型,首先分析物聯網信息系統提供的服務。精準農業應用中,濕度傳感器采集土壤濕度,根據濕度值進行智能的灌溉;智能樓宇應用中,溫度傳感器感知樓宇中的溫度,系統可以根據上報的溫度數據智能調整空調溫度;智能交通應用中,各種傳感器感知路口各個方向的車流量,智能控制相關道路的信號燈,從而有效引導對應區域的車流量。這類服務,都是根據采集到的環境量,進行分析、整合并決策,然后通過調節相應的控制器的操作來反作用于環境,從而提供智能服務,這類服務我們歸結為應用服務。環境監測服務,大量環境信息,例如各種空氣質量參數、圖像以及視頻信息上傳至數據中心,便于用戶隨時獲取;供應鏈管理服務,物品的詳細信息以及流通中產生的大量數據存儲在云服務的數據中心,用戶根據每個物品的EPC(Electronic Product Code)碼,則可快速查詢物品的各種信息。這類服務主要為用戶提供各種數據查詢功能,我們稱之為數據服務。本課題主要針對這兩類服務展開研究。
信息系統既是大數據的重要信息來源,又是提供各種數據與應用服務的核心。大數據的數據量大、數據類型多樣、價值密度低、處理速度快等特征也給構建更為合理的信息服務系統帶來的多種挑戰,針對兩類服務—應用服務和數據服務,從模型建立、服務相關性檢測、行為與活動認知、以及訪問控制四個角度對大數據背景下的信息系統服務進行研究,相應的研究成果希望能夠通過模型化的形式更加精確的描述信息系統中的服務,并使服務之間的冗余性、沖突性更低;對行為模式的學習與活動認知能夠幫助構建更為合理的信息系統服務。各個異構信息系統之間頻繁的信息交互、新興網絡的涌現對構建數據中心的訪問控制戰略提出了更高的要求,這迫切要求我們建立適用于海量數據的安全的動態的數據服務訪問機制。由于海量數據帶來繁多細粒度的服務。服務內部以及多個服務之間都會存在一定的關聯性,比如服務規則的冗余性、沖突性,因此還需要對服務的相關性進行研究。進而對海量感知和操作數據的行為模式與活動進行認知和學習,從而便于生成和提供更加精準和人性化的服務。在數據建模的基礎上,對數據服務上下文進行梳理與研究,提取數據和用戶的可視性屬性,實現更為靈活、安全、高效、擴展性強的數據服務訪問。
參考文獻
[1] 汪圣利.大數據時代指揮信息系統發展分析[J].現代雷達.2013(05).
[2] 楊小牛,楊志邦,賴蘭劍.下一代信號情報偵察體系架構:大數據概念的應用[J].中國電子科學研究院學報.2013(01).
[3] 張春磊,楊小牛.大數據分析(BDA)及其在情報領域的應用[J].中國電子科學研究院學報,2013(01).
[4] 段松青,吳斌,于樂,王柏. PDM:基于Hadoop的并行數據分析系統[J].湖南大學學報(自然科學版),2012(10).