999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

大數據產業研究綜述

2018-03-22 12:03:56廖勁為于娟
現代商貿工業 2018年6期
關鍵詞:大數據技術大數據

廖勁為 于娟

摘 要:大數據是信息技術發展融合的新焦點和新引擎,正深刻影響著經濟和社會的發展。為了促進我國大數據產業的發展,首先從國內外大數據產業概況、相關政策規劃、大數據技術等三方面概述大數據產業發展現狀,然后從我國信息化水平建設現狀出發,從數據開放、人才培養和技術研發三方面給出我國發展大數據產業的建議。

關鍵詞:大數據;大數據產業;產業政策;大數據技術

中圖分類號:F2 文獻標識碼:Adoi:10.19311/j.cnki.1672-3198.2018.06.003

1 引言

大數據(Big Data),是指利用傳統數據處理應用捕獲、管理和處理數據所耗時間超過可容忍時間的巨量數據集。大數據是信息技術發展融合的新焦點,是信息產業持續高速增長的新引擎,正深刻影響著經濟和社會的發展。自2012年起,美、英、德、日等發達國政府紛紛發布大數據相關的綱領性文件,意圖通過實施大數據戰略改善社會生產力、創造新的經濟社會價值,進而提升國家核心競爭力。2015年9月,我國國務院發布《促進大數據發展行動綱要》,將發展大數據產業上升到我國國家戰略。

2 大數據產業

大數據產業主要特征:(1)數據資產化。數據滲透到社會的方方面面,逐漸成為各組織的核心資產之一,是大數據產業發展的核心驅動力。(2)技術高創新性。大數據產業的關鍵技術包括高效率低成本的大數據存儲、索引查詢、數據清洗、異構數據集成以及數據可視化等。(3)決策智能化。組織決策從業務層到戰略層均需利用數據支持決策,“用數據說話”,克服決策者的有限理性,推動決策朝著科學化、智能化的方向發展。(4)服務個性化。通過數據挖掘用戶的興趣和偏好,提供個性化服務,提高服務質量,滿足用戶更高層次需求并獲得更高的經濟收益。

2.1 大數據產業鏈

大數據產業鏈是以大數據產品價值鏈為線索沿橫向從數據收集、存儲、分析到應用逐級遞進,以大數據技術為中心沿縱向從底層的基礎硬件設施、大數據軟件技術到頂層的完整IT解決方案服務,大數據產業鏈各環節如圖1所示。

2.2 大數據產業規模

隨著大數據成為國家戰略以及大數據技術和商業模式的逐漸成熟,大數據在各行業、各領域快速拓展。市場焦點從概念炒作迅速轉移到實際應用,大數據進入全面發展的快車道,呈現出應用創新成為主要驅動力、融資并購成為市場熱點、產業生態不斷優化和基礎設施建設更加合理等特點。

美國憑借信息技術優勢和軟硬件核心技術基礎占據了大數據產業鏈前端;歐洲、日本、韓國和澳大利亞等國家處于政府引導和基礎研究階段。目前我國大數據發展屬于初級階段,但各地開展大數據研究和應用的積極性高漲,都在加速推廣大數據的理論研究和實踐開發,近幾年市場規模明顯增速。2016年我國大數據市場規模約168億,同比增長45%,預計2017-2020年增速保持在30%以上。但目前不可忽視的是我國還未形成完整成熟的大數據產業鏈,尤其缺少成熟的高端產品和配套服務。大數據存儲和云計算服務仍是目前的主流產品,而數據收集和集成的前端服務,數據挖掘分析和可視化的后端產品,及大數據整體解決方案仍存在巨大空白。

目前我國大數據產業鏈呈現初級階段發展不均衡,區域分布明顯等特征:(1)京津冀,集聚效應開始顯現,產業鏈條初步健全;(2)長三角,開展布局城市增多,智慧城市、云計算成重要支撐;(3)珠三角,政策扶持持續發力,產業發展進入良性循環;(4)中西部,鼎足之勢初現端倪,漸成產業發展新增長點。

2.3 大數據產業實踐

大數據,在經濟預警、輿情分析、健康醫療、農業精準管理、城市綜合治理、電信運營、互聯網金融、電子商務等領域已出現先導應用并在不斷深化。大數據產業實踐主要由數據擁有者、技術提供商、數據運營商和數據應用者四個主要角色構成。

(1)數據擁有者是指擁有數據的組織,包括有數據且運用較成熟的互聯網企業,如百度、Google;有數據但運用不好的傳統組織,例如政府、銀行;采集開放數據或與其他數據擁有者合作而獲得數據資源的大數據服務商,如九次方。

(2)技術提供商是為數據擁有者提供數據采集、存儲、計算、分析、咨詢等服務的企業,包括提供基礎軟硬件領域的IBM和華為等,計算服務領域的Amazon和微軟等,大數據分析領域的Palantir和Splunk等。

(3)數據運營商是對數據進行加工處理后,以數據產品、數據應用等形式直接為需求方提供服務的企業,如阿里巴巴和沃爾瑪等,可能同時擁有大數據資源、大數據核心分析技術和大數據場景化應用能力。

(4)數據應用者是大數據價值的最終受益者,通過對自有數據資源的開發、重用或者從外部購買數據產品,將其應用于自身的業務場景或服務場景中創造新的價值,如信貸服務和智能交通領域。

3 大數據產業政策規劃

3.1 國外相關政策規劃

為了充分利用大數據的潛在價值,美、英、德、日等發達國政府均制定了大數據相關的綱領性文件,并啟用官方數據開放門戶,助力大數據從收集、集成到分析等的大數據處理過程。本文依據相關信息整理了主要發達國家發展大數據的戰略文件,如表1所示。

表1說明,國外政府大數據政策措施具有以下特征:

(1)從戰略層面規劃布局我國大數據產業鏈。為搶占大數據發展主動性,多數國家搶先頒布國家戰略層面規劃推動國內大數據理論研究、技術研發、產業發展和交叉領域應用,以確保國家在大數據領域的國際領先地位。

(2)重視政策輔助。具體來說包括數據開放共享、產業扶持、人才培養、資金保障等,力求構筑良性生態環境。

3.2 我國相關政策規劃

各部委大數據相關政策與規劃。在2010年后,特別是2014年以后各部委密集制定出臺了諸多關于大數據產業的決定、規劃和指導意見,對大數據產業進行明確的支持和鼓勵。詳見表2。

地方政府大數據相關政策與規劃。大數據產業野蠻生長的同時,我國一些地方政府也開始密集出臺相關政策,對大數據產業進行支持、規劃和指導。依據我國信息化水平較高地區的政府網站,整理相關政策如表3。

表2和表3說明,我國從中央政府到地方政府均積極推進大數據產業建設。但相比歐美等發達國家,我國信息化總體水平比較落后,大數據產業發展起步較晚,導致配套規劃與政策存在較多缺口。

4 大數據技術

大數據產業發展以大數據技術為基礎,包括:針對大數據“4V”特征的大數據收集、存儲、分析與可視化等大數據處理技術。大數據處理流程是指:在合適工具的輔助下,按照一定的標準對廣泛異構的數據源進行收集和集成,并統一存儲;利用恰當的數據處理技術分析提取存儲數據中有益的知識信息,并通過恰當的方式將結果展現給終端用戶。Hadoop作為一個可開發與運行處理大數據的軟件平臺,解決了大數據處理流程的一些關鍵問題。按照圖1所示大數據產業鏈的大數據處理流程,分析大數據技術研究現狀。

4.1 大數據收集

大數據收集是指對組織內部已有數據和組織外部數據等進行收集、整合的過程。這些數據包括組織原有信息系統的數據,以及通過網絡爬蟲、物聯網、社交網絡等各種方式收集的結構化、半結構化及非結構化的海量數據。

(1)數據倉庫技術。利用ETL(數據抽取、轉換和加載)技術對不同數據源中的異構數據抽取到臨時中間層進行清洗、轉換、集成,然后加載到數據倉庫中,作為OLAP(聯機分析處理)、數據分析的基礎。

(2)網絡爬蟲技術。網絡爬蟲和主題爬蟲能夠自動有效地提取萬維網上的相關網頁,是大數據收集的核心技術之一。Nutch是一種基于Java開源的完全分布式爬蟲,可以在Hadoop的分布式集群上運行,并實現大規模信息收集。

(3)物聯網技術。物聯網結合硬件和軟件兩方面來實現對結構化、半結構化、非結構化的海量數據的智能化識別、監控、接入、傳輸、初步處理和管理等。

4.2 大數據存儲

大數據存儲是指把不同來源、不同格式及不同類型的數據在邏輯上或物理上有機的集中,并納入到數據聚合平臺中,方便數據的輸入和輸出。大數據存儲技術分為文件系統和數據庫系統兩部分。

大數據文件系統解決海量且形態各異的數據存儲問題,分布式系統的容錯問題及大數據中的冗余問題等。目前典型的大數據文件系統有:分布式文件系統GFS(Google File System)和Ceph、以流數據訪問模式存儲超大文件的HDFS(Hadoop Distributed File System)、基于分布式內存的“低延遲”文件系統Tachyou。

在數據庫系統方面,相對于傳統關系型數據庫技術,大數據的數據庫系統更重視分布式數據存儲的一致性問題。根據一致性要求的強弱不同,分布式數據存儲策略可分為ACID和BASE兩類。ACID是指數據庫事務具有的4個特性:原子性(atomicity)、一致性(consistency)、隔離性(isolation)、持久性(durability),對一致性要求比較強。BASE則指:基本可用(basically available)、柔性事務/軟狀態(soft-state,允許暫時不同步)和最終一致性(eventual consistency),對一致性要求較弱。表4列舉了常見的分布式數據庫系統。

基于BASE的數據庫系統主要強調可用性和弱一致性,這種系統無法較好地處理分布式數據存儲的一致性問題。為此,Google研發了基于ACID的具有高可擴展性和高可用性的Megastore、Spanner和Mesa系統:Megastore系統基于Bigtable,能夠實現類似關系型數據庫管理系統的數據模型;Spanner系統彌補了Megastore在吞吐量方面的缺陷,支持細粒度控制副本以及讀和寫的外部一致性;Mesa系統是一個具備跨地域復制和近實時特性的可伸縮數據倉庫,具有PB級數據處理能力和亞秒級響應能力。

4.3 大數據分析

大數據分析是指利用機器學習、數據挖掘、統計學等方法挖掘潛藏在數據中的深度信息,為商務智能、決策支持、信息預測等提供有用信息,實現數據的增值。由于數據來源的多樣性、數據結構的復雜性、數據量的快速增長,大數據建模完全超出傳統技術能夠處理的范圍,目前尚未見有效的多源異構數據分析模型。

目前,大數據計算框架主要有:批處理框架、流處理框架、交互式計算框架和圖處理框架等。

(1)批處理框架。Google的Map-Reduce編程模型是最具代表性的批處理框架。其核心設計思想是:將問題分而治之,以及通過將計算推導數據而不是數據推導計算,有效避免了因數據傳輸產生的大量通信開銷。Map-Reduce模型簡單,且現實中很多問題都可用Map-Reduce模型來表示,在生物信息學、文本挖掘等領域得到廣泛的應用。

(2)流處理框架。Twitter的Storm是最具代表性的流處理框架之一,其工作流程是:主控節點接受提交的任務,并負責將該任務分發給工作節點執行;工作節點上運行的后臺程序Supervisor調度該任務去執行特定的代碼。Storm編程模型簡單、容錯性高,且可快速可靠地處理消息。除此之外,常見的流處理框架還有Facebook的Scribe和Linkedin的Samza等。

(3)交互式計算框架。Spark是最具代表性的交互式計算框架之一,提出了一個新的數據存儲概念RDD,能夠在并行計算的各個階段進行有效的數據共享,極大提高了數據存儲和查詢效率。

(4)圖處理框架。Pregel是Google針對分布式圖計算、BSP(Bulk Synchronous Parallel,整體同步并行計算模型)研發的計算框架,其基本思想是以節點(有活躍及不活躍兩種狀態,初始狀態為活躍狀態)為中心進行計算,完成計算后每個節點主動進入不活躍狀態,如果接收到信息,則激活,沒有活躍節點和消息時,整個算法結束。Pregel主要用于BFS圖遍歷、最短路、PageRank計算等。

在實際的生產環境中,為解決不同問題,常常需要將多種大數據計算框架部署在統一的集群中,共享集群資源,為上層應用提供統一的資源管理和調度,是集群實現更好的資源管理利用和數據共享。典型的統一資源管理與調度平臺有YARN和Mesos。

4.4 大數據可視化

數據可視化,是指數據及數據分析結果的視覺表現形式和相應的人機交互技術,是將數據以清晰、簡單易懂的圖形圖像等形式進行展示,以便更直觀和高效地洞悉大數據背后的信息和發現其中未知信息的處理過程。相比傳統的結構化數據的可視化,大數據可視化更著重于文本等非結構化數據的可視化技術的研發。

文本可視化是指將文本中蘊含的語義特征(如詞頻、主題、邏輯結構等)直觀地展示出來。典型的文本可視化技術是標簽云,將關鍵詞根據詞頻或其他特征按照一定規律進行布局排列,用字體、顏色、大小等圖形屬性對關鍵詞進行可視化。除此之外,還有DAViewer和DocuBurst等語義結構可視化技術。

網絡的圖可視化,基于網絡節點和連接的拓撲關系,直觀展示網絡中的潛在模式關系。典型的圖可視化技術TreeNetViz,綜合了放射圖、基于空間填充法的樹圖等技術,直觀展示了圖節點之間的關系,但缺乏對大數據環境下的可視化支持,在此基礎上,Hurter等人提出基于邊捆綁的方法,使得復雜網絡可視化效果更為清晰。

此外,大數據背景下,多維數據的數據項分布規律及其屬性之間的潛在關系的可視化也是當前的研究熱點之一。投影是多維數據可視化的代表性技術之一,將各維度屬性集合通過投影函數映射到一個方塊形圖形標記中,并根據維度之間的關聯度對各個小方塊進行布局,既反映了維度屬性值的分布規律,也直觀展示了多維度之間的語義關系。除此之外,還有散點圖和平行坐標(parallel coordinates)等技術。

5 我國大數據產業發展建議

依據國內外大數據產業發展現狀,從我國信息化水平現狀的實際出發,結合我國大數據產業相關的政策與規劃,對我國發展大數據產業提出相應對策和建議如下幾點。

5.1 適度開放數據資源

數據的開放與整合是大數據開發利用的先決條件。如何突破“不愿、不敢、不會”開放數據的瓶頸,是大數據產業發展的重點和難點。

政府是大規模原始數據的采集者。可以行政中心數據系統為依托,推進公共數據資源的集中與適度開放。在已出臺的《政務信息資源共享管理暫行辦法》的基礎上,進一步細化政府部門以及事業單位等公共機構數據資源清單和格式標準。在政務數據系統的基礎上,集合匯聚各部門包括垂直部門及各市的政務數據,建立各級政府和部門間的數據交換共享機制,建設統一的政務數據資源庫,設立面向社會的政府數據服務網,進一步推進政務公開工作。

此外,還應建設企事業單位的大數據庫,推進行業內數據資源的共享和分析。可以借鑒“廣東省企業情況綜合數據平臺”的做法,分塊和集中管理相結合,綜合政府部門、社會、互聯網等不同渠道數據,建設政府統一的經濟管理大數據庫,通過ETL技術重點集成企業的幾個關鍵維度數據,完善政府企業綜合數據收集工作,掌握和分析企業生產經營情況,繪制經濟地圖,發布產業數據,適度促進數據的開放、分析與再利用。

5.2 引培大數據人才

大數據建設的各個環節都依賴專業人員完成,但我國大數據人才缺口很大。為此,應充分發揮高等院校的科研力量和師資優勢,增設大數據相關專業和體系,同時加大科研投入。培養我國本土信息化高素質復合人才,重點加快加強信息管理、統計學領域碩士生和博士生等高端人才的培養。加大在職信息領域工程碩士的招生力度,力求培養高層次大數據管理和技術人才。另一方面,擴大人才基數,對各行業在崗在職的社會人員進行大數據繼續教育和培訓,使其認清大數據的價值,提升大數據素養,明晰大數據需求與應用理念。

此外,還可制定對口優惠的人才引進政策,在已有“千人計劃”上更有針對性地從國外引進建設與發展大數據所需的各類高層次人才。各地政府還可以借鑒北京市建立的“首都信息化人才培養基地”對精英人才進行培訓,通過加強類似同類型基地的建設,筑巢引鳳以吸引海內外人才和項目,并能夠對他們進行系統性的本土化培育,了解我國整體背景,讓人才更有方向性地投入我國發展大數據的實踐中。

5.3 攻關大數據技術

由于國內外對大數據技術的研發方興未艾,發展大數據產業將面臨各方面的大數據技術挑戰:(1)大數據收集技術,數字化不夠及數據質量問題將影響大數據的整合與開發和數據分析結果的準確性。(2)大數據存儲技術,傳統的關系型數據庫已無法滿足大數據存儲和快速檢索的需要。(3)大數據分析技術,如何高效實時地對大量多源異構數據進行全局分析,發揮數據整合的力量,是大數據的關鍵難題之一。(4)大數據可視化技術。大數據分析的結果需要以簡潔、直觀易懂的形式展示、解釋給用戶。

數據安全是大數據產業健康發展的重要保障,面臨的主要挑戰有:(1)用戶隱私保護技術,大數據未被妥善處理,會對用戶的隱私造成極大損害,甚至危害國家安全。(2)數據可信驗證技術,大數據分析的基礎是可信的數據,但數據在傳播中會逐步失真,甚至出現偽造的數據。(3)訪問控制技術,大數據通常應用與多個場景,需要對不同用戶設置不同的訪問權限。

6 結論

目前我國大數據產業尚處于起步階段,整體發展要基于現實的信息化發展水平和國情。發展大數據產業,既需要較高的信息化水平和良好的信息產業發展環境為基礎,也要有先進的管理理念和應用實踐來牽頭。一方面需要轉變管理理念,另一方面需要解決關鍵技術問題。從管理理念上,要重視數據資產,決策過程“用數據說話”。在技術上,要研發有效低價的大數據的收集、存儲、分析和可視化等關鍵環節技術。

參考文獻

[1]Wikipedia. Big data[EB/OL]. https://en.wikipedia.org/wiki/Big_data.

[2]James M, Michael C, Brad B, et al. Big Data: The Next Frontier for Innovation, Competition, and Productivity [R]. McKinsey Global Institute, 2011: 8-10.

[3]Jeffrey M. U.S. Science Policy: Agencies Rally to Tackle Big Data [J]. Science, 2012, 336(6077): 22.

[4]Alexandros L, Jagadish H. V. Challenges and Opportunities with Big Data [C]. In: Proc. VLDB Endowment, 2012, 5(12): 2032-2033.

[5]國務院. 促進大數據發展綱要[EB/OL]. [2015-09-05]. http://www.gov.cn/zhengce/content/2015-09/05/content_10137.htm.

[6]福建省人民政府發展研究中心課題組 李強, 陳明旺, 劉立菁. 推進福建大數據發展的對策思考[J]. 發展研究, 2015,(12): 8-15.

[7]迪莉婭. 我國大數據產業發展研究[J]. 科技進步與對策, 2014,(4): 56-60.

[8]李文蓮, 夏健明. 基于“大數據”的商業模式創新[J]. 中國工業經濟, 2013,(5):83-95.

[9]貴陽大數據交易所. 2016年中國大數據交易產業白皮書[R]. 2016,05(25).

[10]陳桂龍. 我國大數據發展狀況[J]. 中國建設信息化, 2015,(Z1):34-35.

[11]中國信通院. 2017年中國大數據發展調查報告. 2017,03(28).

[12]中國電子信息產業發展研究院. 2015年中國信息化發展水平評估報告[EB/OL]. [2016-06-14]. http://www.miit.gov.cn/n1146290/n1146402/n1146445/c4838381/part/4838390.pdf.

[13]孫麗娟. 大數據產業鏈及變現[J]. 通信企業管理, 2016,(6):38-41.

[14]毛國君, 胡殿軍, 謝松燕. 基于分布式數據流的大數據分類模型和算法[J]. 計算機學報, 2017,(1):161-175.

[15]孟小峰, 慈祥. 大數據管理:概念、技術與挑戰[J]. 計算機研究與發展, 2013, 50(1): 146-169.

[16]Dittrich J, Quiané-Ruiz J A. Efficient big data processing in Hadoop MapReduce[J]. Proceedings of the VLDB Endowment, 2012, 5(12): 2014-2015.

[17]徐俊剛, 裴瑩. 數據ETL研究綜述[J]. 計算機科學, 2011, 38(4):15-20.

[18]胡萍瑞,李石君. 基于URL模式集的主題爬蟲[J]. 計算機應用研究,2018,(03):1-2.

[19]Yu G, Xie X, Liu Z. The design and realization of open-source search engine based on Nutch[C]//Anti-Counterfeiting Security and Identification in Communication (ASID), 2010 International Conference on. IEEE, 2010: 176-180.

[20]錢志鴻, 王義君. 物聯網技術與應用研究[J]. 電子學報, 2012, 40(5):1023-1029.

[21]Ghemawat S, Gobioff H, Leung S T. The Google file system[C]// Nineteenth ACM Symposium on Operating Systems Principles. ACM, 2003:29-43.

[22]Weil S A, Brandt S A, Miller E L, et al. Ceph: A scalable, high-performance distributed file system[C]//Proceedings of the 7th symposium on Operating systems design and implementation. USENIX Association, 2006: 307-320.

[23]Shvachko K, Kuang H, Radia S, et al. The hadoop distributed file system[C]//Mass storage systems and technologies (MSST), 2010 IEEE 26th symposium on. IEEE, 2010: 1-10.

[24]Li H, Ghodsi A, Zaharia M, et al. Tachyon: Reliable, memory speed storage for cluster computing frameworks[C]//Proceedings of the ACM Symposium on Cloud Computing. ACM, 2014: 1-15.

[25]陳軍成, 丁治明, 高需. 大數據熱點技術綜述[J]. 北京工業大學學報, 2017,(03):358-367.

[26]DeCandia G, Hastorun D, Jampani M, et al. Dynamo: amazon's highly available key-value store[J]. ACM SIGOPS operating systems review, 2007, 41(6): 205-220.

[27]Lakshman A, Malik P. Cassandra: a decentralized structured storage system[J]. ACM SIGOPS Operating Systems Review, 2010, 44(2): 35-40.

[28]Chang F, Dean J, Ghemawat S, et al. Bigtable: A distributed storage system for structured data[J]. ACM Transactions on Computer Systems (TOCS), 2008, 26(2): 1-26.

[29]RIOS G, JUDD D. Load balancing for hypertable[C]//Proceedings of the 8th AAAI Conference on AI for Data Center Management and Cloud Computing ( AAAIWS'11-08). San Francisco: AAAI Press, 2011: 24-26.

[30]Chodorow K. MongoDB: the definitive guide[M]. Cambridge: O'Reilly Media, Inc., 2010:1-193.

[31]Anderson J C, Lehnardt J, Slater N. CouchDB: The Definitive Guide. Time to relax[M]. Cambridge: O'Reilly Media, Inc., 2010:1-245.

[32]Webber J. A programmatic introduction to neo4j[C]//the 3rd annual conference on Systems, programming, and applications: software for humanity. ACM, 2012: 217-218.

[33]Roggen D, Lombriser C, Rossi M, et al. Titan: an enabling framework for activity-aware" pervasive apps" in opportunistic personal area networks[J]. EURASIP Journal on Wireless Communications and Networking, 2011,(1): 1-22.

[34]Baker J, Bond C, Corbett J C, et al. Megastore: Providing scalable, highly available storage for interactive services[C]//CIDR. 2011, 11: 223-234.

[35]Corbett J C, Dean J, Epstein M, et al. Spanner: Google's globally distributed database[J]. ACM Transactions on Computer Systems (TOCS), 2013, 31(3): 8.

[36]Gupta A, Yang F, Govig J, et al. Mesa: Geo-replicated, near real-time, scalable data warehousing[J]. Proceedings of the VLDB Endowment, 2014, 7(12): 1259-1270.

[37]Xindong Wu, Xingquan Zhu, Gong-Qing Wu, et al. Data Mining with Big Data [J]. IEEE Transactions on Knowledge and Data Engineering (TKDE), 2014, 26(1): 97-107.

[38]Dean J, Ghemawat S. MapReduce: simplified data processing on large clusters[J]. Communications of the ACM, 2008, 51(1): 107-113.

[39]Christensen R, Wang L, Li F, et al. STORM: Spatio-temporal online reasoning and management of large spatio-temporal data[C]//Proceedings of the 2015 ACM SIGMOD International Conference on Management of Data. ACM, 2015: 1111-1116.

[40]Scribe[EB/OL]. Scribe. https://www.scribesoft.com/.

[41]Goodhope K, Koshy J, Kreps J, et al. Building LinkedIn's Real-time Activity Data Pipeline[J]. IEEE Data Eng. Bull., 2012, 35(2): 33-45.

[42]Zaharia M, Chowdhury M, Franklin M J, et al. Spark: cluster computing with working sets[C]// Usenix Conference on Hot Topics in Cloud Computing. USENIX Association, 2010:1765-1773.

[43]Malewicz G, Austern M H, Bik A J C, et al. Pregel: a system for large-scale graph processing[C]//Proceedings of the 2010 ACM SIGMOD International Conference on Management of data. ACM, 2010: 135-146.

[44]Vavilapalli V K, Murthy A C, Douglas C, et al. Apache hadoop yarn: Yet another resource negotiator[C]//the 4th annual Symposium on Cloud Computing. ACM, 2013: 5.

[45]Hindman B, Konwinski A, Zaharia M, et al. Mesos: A Platform for Fine-Grained Resource Sharing in the Data Center[C]// Proceedings of the 8th USENIX Symposium on Networked Systems Design and Implementation. 2011, 11(2011): 22-22.

[46]任磊, 杜一, 馬帥,等. 大數據可視分析綜述[J]. 軟件學報, 2014,(9):1909-1936.

[47]Wu Y, Provan T, Wei F, et al. Semantic‐preserving word clouds by seam carving[C]//Computer Graphics Forum. Blackwell Publishing Ltd, 2011, 30(3): 741-750.

[48]Zhao J, Chevalier F, Collins C, et al. Facilitating discourse analysis with interactive visualization[J]. IEEE Transactions on Visualization and Computer Graphics, 2012, 18(12): 2639-2648.

[49]Collins C, Carpendale S, Penn G. Docuburst: Visualizing document content using language structure[C]//Computer graphics forum. Blackwell Publishing Ltd, 2009, 28(3): 1039-1046.

[50]Gou L, Zhang X L. Treenetviz: Revealing patterns of networks over tree structures[J]. IEEE Transactions on Visualization and Computer Graphics, 2011, 17(12):2449-2458.

[51]Hurter C, Ersoy O, Telea A. Graph bundling by kernel density estimation[C]//Computer Graphics Forum. Blackwell Publishing Ltd, 2012, 31(3pt1): 865-874.

[52]Lee J H, McDonnell K T, Zelenyuk A, et al. A structure-based distance metric for high-dimensional space exploration with multidimensional scaling[J]. IEEE transactions on visualization and computer graphics, 2014, 20(3): 351-364.

[53]Elmqvist N, Dragicevic P, Fekete J D. Rolling the dice: Multidimensional visual exploration using scatterplot matrix navigation[J]. IEEE transactions on Visualization and Computer Graphics, 2008, 14(6): 1539-1148.

[54]Geng Z, Peng Z M, Laramee R S, et al. Angular histograms: Frequency-based visualizations for large, high dimensional data[J]. IEEE Transactions on Visualization and Computer Graphics, 2011, 17(12): 2572-2580.

[55]國務院. 政務信息資源共享管理暫行辦法[EB/OL]. [2016-09-05]. http://www.gov.cn/zhengce/content/2016-09/19/content_5109486.htm.

[56]數聯尋英. 大數據人才報告[EB/OL].[2016-07-15]. http://www.shulianxunying.com/.

猜你喜歡
大數據技術大數據
大數據技術在電子商務中的應用
大數據技術對新聞業務的影響研究
論大數據技術在智能電網中的應用
高校檔案管理信息服務中大數據技術的應用
大數據技術在電氣工程中的應用探討
大數據技術在商業銀行中的應用分析
大數據環境下基于移動客戶端的傳統媒體轉型思路
新聞世界(2016年10期)2016-10-11 20:13:53
基于大數據背景下的智慧城市建設研究
科技視界(2016年20期)2016-09-29 10:53:22
數據+輿情:南方報業創新轉型提高服務能力的探索
中國記者(2016年6期)2016-08-26 12:36:20
主站蜘蛛池模板: 日韩不卡高清视频| 国产免费a级片| 在线观看国产黄色| 国产日韩欧美精品区性色| 精品国产成人高清在线| 欧美在线三级| 欧美午夜视频在线| 女同久久精品国产99国| 99视频在线看| 国产网站一区二区三区| 日韩一区二区在线电影| 亚洲免费三区| 综合色在线| 黄色网页在线观看| 思思99热精品在线| 无码内射中文字幕岛国片| 97国产成人无码精品久久久| 一级全免费视频播放| 久久福利片| 国产裸舞福利在线视频合集| 五月婷婷导航| 日韩高清一区 | 欧美日韩资源| 亚洲人成色77777在线观看| 波多野结衣的av一区二区三区| 亚洲精品无码日韩国产不卡| 91蝌蚪视频在线观看| 国产白浆视频| 久久亚洲黄色视频| 国产美女自慰在线观看| 欧美无遮挡国产欧美另类| 亚洲成人黄色网址| 乱人伦中文视频在线观看免费| 国产精品欧美在线观看| 激情影院内射美女| 亚洲国产系列| 少妇高潮惨叫久久久久久| 999国产精品| 国产日韩欧美精品区性色| 91成人在线观看| 欧美日本中文| 欧美区国产区| 伊大人香蕉久久网欧美| 2024av在线无码中文最新| 欧美精品二区| 国产www网站| 亚洲国产成人精品无码区性色| 亚洲三级片在线看| 67194成是人免费无码| 女同国产精品一区二区| 亚洲美女一级毛片| 嫩草在线视频| 欧美全免费aaaaaa特黄在线| 日韩高清中文字幕| 伊人久久综在合线亚洲2019| 午夜成人在线视频| 国产成人精品在线| 免费一级毛片不卡在线播放| 欧类av怡春院| 久久久久久高潮白浆| 国产在线观看91精品| 手机精品视频在线观看免费| 日本三级欧美三级| 日韩av高清无码一区二区三区| 国产精品亚欧美一区二区三区 | 国产97视频在线| 伊在人亞洲香蕉精品區| 88av在线看| 亚洲人妖在线| 欧美精品不卡| 日韩成人免费网站| 精品久久久无码专区中文字幕| 成人一区专区在线观看| 亚洲人成在线精品| 中文字幕乱码二三区免费| 亚洲IV视频免费在线光看| 亚洲九九视频| 欧美a级在线| 国产91精品最新在线播放| 国产精品久久久久久久久久98| yjizz视频最新网站在线| 国产精品一区二区国产主播|