成 勇
(中國移動通信集團廣西有限公司, 南寧 530022)
隨著社會經濟的不斷發展,科學技術日新月異,不斷地創新和改進,尤其是計算機信息技術更是成為人們生活和生產過程中不可分割的重要組成部分,為人們的生活、生產方式帶來了巨大的改變,受到各界人士的廣泛關注。近年來,社會已經朝著信息化的方向發展,一系列信息技術都取得了不錯的成績,無論是互聯網或是物理信息系統技術都得到了充分的發展,受到各界人士的廣泛關注。鑒于這種狀況,大數據的發展規模逐漸擴大,所涵蓋的內容面積也越來也多,涉及的范圍逐漸擴展。在這種環境下,許多領域都開始紛紛試用大數據,無論是制造業、交通行業還是服務業和醫療業等都充分應用了大數據的作用,取得了有效的成功。信息數據的使用已經成為我國社會經濟的重要內容。
大數據是一個數的幾何體,其具有以下幾個性質:第一,大數據具有一致性,在數據幾何中所包含的各類信息保持相同性,對于一些無法與大數據信息相符合或是出現錯誤的信息則不屬于數據集合中。當大數據中的信息出現不一致的現象,則說明其存在一定的危險性,可進行有效的審查。比如說,某一張信用卡同時在兩個城市消費,而消費的數據不一致,則說明信用卡的使用出現了問題;第二,大數據具有準確性。在大數據中的每一個數據都代表著一個實體,能夠準確地反映出某一事件的具體情況和數據;第三,大數據具有一定的完整性。數據集合中的數據應當包含各方面的數據內容,要予以人們查詢和計算,比如說在醫院的數據庫中,為保障醫療工作的順利開展,則必須確保數據庫信息的完整性,不可遺失任何重要的數據,以防止影響醫療工作者的判斷;第四,大數據具有時效性。數據集合中的數據都符合于現階段的發展情況,能夠保持與時俱進,確保信息的先進性;第五,大數據具有實體同一性。數據幾何中的各項數據在描述的過程中具有統一性,享有共同的描述。我們可以將滿足以上這五種信紙的數據集合稱之為大數據的可用性。
現階段,在大數據可用性的研究過程中仍然存在著一定的問題,還有待進一步完善。其問題主要在于以下方面:首先,在獲取高質量數據方面還存在著一定的問題。在此方面所遇到的挑戰主要在于如何充分利用高質量大數據的理論,來進行數據的過濾,剔除一些無用的數據,以保障所收獲的數據符合要求,具有較高的質量。在研究大數據的可用性的時候,應當考慮如何將數據可用性形象化的表示出來,要思考在理論上如何判斷數據的可用性并且對其進行定量方面的評估。現階段,由于缺乏健全的大數據可用性理論體系,以至于難以解決以上這些問題。
通常而言,大數據的來源主要來自于三個方面。一個方面是從Web網站上建立的數據庫來收獲相應的數據資源,一個方面是來自于社會中的各種物理系統。比如說智能電網等,另一個方面主要是通過科學的實驗來觀測和采集相應的數據。為了保障大數據的可用性,一定要確保大數據的高質量。
大數據高質量的整合,應當處理好數據之間的復制關系,對靜態數據進行貝葉斯分析,對動態數據可實施馬爾可夫模型,以此來確定數據之間的復制關系并進行有效的改善,保障大數據高質量的整合效果。
為了提高大數據的質量,提升大數據的可用性,則必須建立完善的大數據可用性理論體系。在建立大數據可用性理論體系的過程中,應當遵循語義規則,以統計學為基礎來對大數據進行描述,以保障數據的完整性。除此之外,為了提高數據的精準性,應當提高數據的實效性,通過完善的理論體系來判斷數據的時效性,以確保在第一時間獲得有效的數據,發現數據中存在的問題,并進行自動地修復和完善。為了提高數據的同一性,可以應用等值理論,通過對數據屬性的等價關系來進行同一性的描述,以保障大數據的可用性。
二十一世紀是一個信息化時代,信息技術日新月異,受到人們的不斷追捧。在制定大數據可用性的相關內容之后,我們發現企業的相關研究的內容也隨之擴展,大數據的應用效果則受到充分的關注,以求取得一定的突破,提高我國國計民生質量,加強社會和諧建設的發展,從而促進大數據的可持續發展。在大數據系統的研究發展過程中,應當重視對大數據的應用,充分發揮大數據的可用性,提高大數據在社會各領域中的有效作用,從而保障大數據可用性的有效應用,推動大數據研究工作健康而穩定的發展。
[1]李建中,劉顯敏.大數據的一個重要方面:數據可用性[J].計算機研究與發展,2013(06):1147-1162.
[2]王玲,楊巍.互聯網大數據可用性增長方式研究[J].國防科技,2013(06):52-55.
[3]孫立,楊軍,潘坤友.基于大數據可用性的政府統計策略研究[J].科技管理研究,2014(19):35-37.
[4]張蘭廷.大數據的社會價值與戰略選擇[D].中共中央黨校,2014.