蔡志珍
(廣東理工學院, 廣東 肇慶 526100)
計算機大數據:現狀與展望
蔡志珍
(廣東理工學院, 廣東 肇慶 526100)
近年來,隨著社會經濟的迅速發展計算機大數據領域成為政府的重點發展對象,這是因為國內的數據倉庫系統面臨著數據源、需提供的數據服務和硬件環境等方面發生重大變化.本文根據社會迅速發展的計算機大數據,作出系統的應對方案.倉庫的現實方案及框架存在較大的缺陷,根據研究目的不同被分為三大類:第一并行數據庫;第二,技術混合結構;第三,集成型,這三種筆者期望能為設計滿足時代需求的數據倉庫系統.
計算機;大數據;發展前景
1.1 計算機大數據的概念
最近幾年的互聯網、云計算、三網融合以及物聯網等技術發展更新速度較快,數據的快速增長為眾多的行業帶來機會與挑戰.因而二十一世紀的今天儼然發展成為信息數據化時代,大數據的出現改變了人們的生產生活以及企業的經營方式.這一變革引起了科學研究模式根本性的轉變,一般意義而言,大數據指的是一定時間內利用常規機器和軟件進行獲得、感知、服務、管理和處理的數據集合在一起.而計算機大數據的概念是“電腦、人類、物品”三種不同意義和形態的世界在同一網絡空間互相交融,并合作產生較大的數據被稱為計算機大數據.我國的當前發展狀態是計算機大數據的規模與復雜程序快速的增長,現成的 IT 處理系統和計算能力需要進一步的提升和發展.
1.2 計算機大數據的發展特點
計算機大數據的特點是:承載量大、樣式多速度快.首先是由于網絡的內容中間數據不斷擴充,管理數據不斷膨脹.其次,網絡大數據的種類繁多,都包括:結構化數據、半結構化數據以及非結構化數據,同時帶來新技術的發展.再次,計算機大數據容易出現非線性狀態的變化現象.最后,計算機大數據的移動速度較快,時效性太強.這些計算計大數據的自身特征為其發展特點帶來巨大的影響作用,其不斷深入人們的日常生活,改變了人類作業和生產的方式.目前易趣軟件的工作量高達 100 兆赫,遠遠高于納斯達克的數據處理量.易趣的內涵超出 500 種類型的的數據分析.去年的雙十一節日中,中國的網絡再一次的發生了巨大規模的商業活動,淘寶網站的銷售業績成為歷史上卓越的驕傲超出199.85 億元人民幣.同樣,計算機大數據為專業工作者帶來了巨大的挑戰和機會,為社會科學、信息科學、網絡科學以及系認科學等高科技力領域邁向新的研究方向.計算機大數據為人類的生活帶來更多便利的同時還推動了社會的發展進步.
2.1 應用實踐研究
即使如今的大數據應用研究較為普遍和成功,但是其缺陷和弊端難以避免,較多的問題有待研發談論.以下文字是對計算機大數據的應用實踐研究:
第一,大數據的管理.計算機大數據的誕生對傳統數據的管理模式產生了極大的沖擊.當前,專業人員對大叔的研究主要是針對幾個方面的研究,例如:移動和普適計算機的數據管理、異構和結構多樣化數據的結合、新型硬件的存放模型和數據庫、交友軟件的數據管理、分布式的數據管理等各種各樣的類型.
第二,數據處理系統一直都是大數據領域的研究話題,例如:分布式搜索、語義挖掘、多結構化數據挖掘、機器學習、文本挖掘、圖像挖掘、海量推薦系統和社會媒體系統、實時大數據挖掘、模型社交網絡的搜索和挖掘、大數據搜索算法、P2P 搜索、大數據的可視化分析等幾種計算機大數據的研究內容.
第三,大數據的集成和世系.計算機大數據的集成就是將存在差異的數據進行整合,這樣的組成方式面對著較大的問題.在今天的大數據時代,數據系統的研究對象是眾多的數據集,而不是單個的數據.因此,把各種不同來源和類別的數據世系信息集合在一起是留給世人的難題.
第四,大數據應用.目前的大數據廣泛應用于人們生產生活的各個角落,例如:醫院、工程科學、金融、商務、教育、運輸等等人類的生產生活部分.
2.2 數據安全研究
在信息化的時代,個人的安全和隱私是較為重要的問題.傳統的數據保護方式已經不能適應社會發展的潮流,大數據安全性面臨眾多的挑戰:第一,大數據隱私.數據的隱私包括兩方面內容:一方面,個人隱私保護,個人的興趣、愛好、身體特征、習慣等隱私部分容易被盜取.另一方面,即使得到用戶的允許,個人的財務、信息等重要隱私也有被泄露的風險.第二,數據質量.低質量的數據浪費傳輸和存放資源,甚至其發展被制約.其制約數據質量的因素很多,例如:采集、傳輸、生成以及存儲過程中都可能影響數據的質量發展.第三,大數據的安全機制.大數據的規模和種類為其保密性帶來了巨大的挑戰.面對結構化、半結構化和非結構化的數據需要進行有效的安全管理、安全通信和訪問控制.第四.信息安全領域大數據的應用.大數據為信息安全注入了新的活力,例如:病毒特征、攻擊特征以及漏洞特征等易通過大數據分析被掌握.除此之外,大數據為企業的內部管理和制度帶來便利和認可.信息時代下計算機大數據在某些方面會得到更加充分的利用,國家需要加大開發力度和發現人才.
3.1 大數據未來發展方向與趨勢
現代的計算機大數據出現種類多、規模大和結構復雜的趨勢.隨著大數據時代的快速發展,先前的計算機技術已經被淘汰.為了更好的應對這種計算機大數據的發展態勢,眾多的研究專家開始新一輪的研究,研究成果顯示,谷歌軟件在世界的分布范圍較為廣泛也是最出名的軟件之一.由此而知,要在分布式數據庫發展的基礎上研究計算機大數據的儲存方式,這種類型的儲存方式操作類似 SQL 的語法設置,使得數據操作的效率更高.第一,數據的資源化.計算機大數據中涵蓋了大量的數據信息,這些數據信息隱藏著巨大的價值,進一步證明資源的載體是大數據.第二,促進科技的交叉融合.隨著大數據的發展,云計算、互聯網等技術逐漸走向共融的發展,同時,還增加了各個學科之間的緊密程度.以信息技術為主體,大力創新計算機大數據的技術和方法.趨勢一:數據的資源化,何謂資源化,是指大數據成為企業和社會關注的重要戰略資源,并已成為大家爭相搶奪的新焦點.因而,企業必須要提前制定大數據營銷戰略計劃,搶占市場先機.趨勢二:與云計算的深度結合,大數據離不開云處理,云處理為大數據提供了彈性可拓展的基礎設備,是產生大數據的平臺之一.自 2013 年開始,大數據技術已開始和云計算技術緊密結合,預計未來兩者關系將更為密切.除此之外,物聯網、移動互聯網等新興計算形態,也將一齊助力大數據革命,讓大數據營銷發揮出更大的影響力.趨勢三:科學理論的突破隨著大數據的快速發展,就像計算機和互聯網一樣,大數據很有可能是新一輪的技術革命.隨之興起的數據挖掘、機器學習和人工智能等相關技術,可能會改變數據世界里的很多算法和基礎理論,實現科學技術上的突破.趨勢四:數據科學和數據聯盟的成立未來,數據科學將成為一門專門的學科,被越來越多的人所認知.各大高校將設立專門的數據科學類專業,也會催生一批與之相關的新的就業崗位.與此同時,基于數據這個基礎平臺,也將建立起跨領域的數據共享平臺,之后,數據共享將擴展到企業層面,并且成為未來產業的核心一環.
3.2 數據發展傾向人為本,實現可視化
縱向觀察我國科技發展的深度,人才的力量支撐起計算機大數據的發展.因此,科技發展的根本目的是服務于人類的需求和愿望.在計算機大數據的時代,利用數據分析法可以幫助人類進行正確的決策,但是計算機的策劃不能取代人類根底的思想.關于大數據的應用,人類的思考占大多數的決定性作用.近幾年的發展使得物聯網蓬勃發展,加上遙感技術充分運用在實際生活當中,人類使用大數據時也產生了較大的改變,由消費者演變成為生產者以及參與者.因而,大數據的發展越來越傾向人性化,在社會活動中引起巨大的變革.人類在利用計算機進行工作或者玩游戲時,比較看重眼前的具體圖片或者文本等.將來的計算機大數據發展變化要趨于可視化,而事實中的大數據較為混雜,不經處理的大數據難以正常運用,只有經過加工和分析后的數據才能幫助人類工作.在對大數據進行整合分析之后,其結果才能被大眾看懂和接受,進而提辦事高效率.現階段的研究,計算機大數據僅僅能夠分析出餅狀圖、回歸曲線、報表等數據結果,但是,未來的發展超乎人類的想象,將會研究出更加新型的計算機大數據表現形式.
計算機大數據為人類生產和生活帶來了便利的處理方式,但同時也存在著巨大的挑戰和機遇.本文系統分析了計算機大數據發展特點,繼而說明了其發展的現狀,最后對計算機大數據的未來充滿更高的愿景.現今的計算機大數據超越了傳統研究的模式和思維,向更快捷、更方便、更速度的時代進發.盡管目前我國的計算機大數據已經有了探索性的研究工作,但是從大體上看,計算機大數據的研究較為短淺,還有更多的問題有待解決.
〔1〕孟 小峰,慈祥.大數據管理:概念 、技 術 與 挑 戰[J].計 算 機 研究與發展,2013(01).
〔2〕覃雄派,王會舉,李芙蓉,李翠 平,陳紅,周烜,杜小勇,王珊.數據管理技術的新格局[J].軟件學報,2013(02).
〔3〕高明,金澈清,王曉玲,田秀霞,周傲英.數據世系管理技術研究綜述[J].計算機學報,2013(03).
〔4〕鄔賀銓.大數據思維[J].科學與社會,2014(03).
〔5〕高明,金澈清,王曉玲,田秀霞,周傲英.數據世系管理技術研究綜述[J].計算機學報,2012(03).
TP39
:A
:1673-260X(2016)02-0021-02
2015 年 10 月 19 日