楊寧
中國聯合網絡通信有限公司莘縣分公司 山東聊城 252400
隨著云時代的來臨,大數據也吸引了越來越多的關注。大數據應用范圍廣泛,影響著生活的方方面面。因此,國家要核心數據要進行嚴格保護,要區分好涉密數據,對非涉密性大數據的共享也要做到有效的管理,加強國際間的交流與合作,積極應對國家大數據秘密保護挑戰[1]。
大數據指的是在相應時間內無法用常規方法對信息開展采集、捕捉及管理的數據集合,是需要借助其他處理手段方可有效提煉信息價值的資產。總的來說,大數據具有數據存儲量大、多樣性、高速性等特征,其中,數據存儲量大表明大數據的數據量十分龐大,如今在一些大型企業、專業工業計算機中的數據容量可達到EB級別;多樣性表明大數據既包含以往的結構化數據,還包含廣泛采用文件系統存儲的半結構化數據及非結構化數據;高速性則表明大數據要求數據分析處理應具備實時性。通常而言,大數據的處理流程主要可分為:數據采集與集成、數據分析及數據解釋[2]。
對于大數據的關鍵技術而言,主要包括數據采集技術,數據儲存技術,數據表示、檢索與訪問,數據應用與深層挖掘等,具體而言:①數據采集技術。數據采集技術是大數據技術實現各項功能的重要基礎,換言之,大數據技術要想實現對各項數據的有效處理,切實提升數據應用準確性,必須要得到數據采集技術所提供的有力數據支持。一般來說,大數據技術的數據采集主要通過管理系統、科學實驗、物理信息系統等系統進行實現,依托對該部分系統的整合應用,可實現對一系列數據的高效、全面采集,進而為大數據技術實際應用提供可靠的數據支撐。將數據采集技術應用于人工智能中,可支持人工智能設備對采集數據進行讀取,并開展好初步化分析工作,實現統計分析功能,進一步提升數據應用精準性。②數據儲存技術。數據采集結束后,可通過數據存儲技術,以實現對龐大數據的統一存儲。因為大數據技術應用對數據提出了十分嚴格的要求,所以應設置相應的存儲空間以對海量數據進行存儲,同時要確保數據的安全性、穩定性。目前,常用的數據存儲技術主要可分為傳統結構化數據存儲、半結構化數據及非結構化數據存儲、結構化和非結構化混合數據存儲。對于人工智能設備而言,設備運行必須引入數據存儲技術,實現可靠的數據存儲功能。在人工智能終端上,相關人員通過數據調取操作,可實現對應用數據直接調取,以此不僅可提升人工智能運行效率,還可降低數據傳輸成本。③數據表示、檢索與訪問。如前文所述,大數據具有數據存儲量大、多樣性等特征。基于大數據技術支持,對于數據的獲取要在數據庫中通過關鍵詞檢索進行實踐,而由于檢索操作通常處在平行狀態下,這使得檢索結果可能會存在漏洞,難以滿足數據檢索需求。為此,通過引入HDFS系統,可實現隨訪訪問數據檢索功能,保障各項工作有序運行。④數據應用與深層挖掘。鑒于大數據的特征,還應對數據開展深層挖掘及分析。面對龐大數據,數據應用與深層挖掘可迅速挖掘數據,并在數據庫中獲取對應數據。在大型數據庫中,通過這一技術可保證獲取數據的準確性,依托深層挖掘分析功能,可有效降低數據應用風險,切實提升數據評定與選擇的科學性[3]。
當前,大數據處理技術已經在各行各業中得到廣泛應用,而且很多國家已經將此技術和人工智能技術進行良好結合,進而充分發揮出了這兩項技術的優勢。從目前我國的大數據技術來看,其應用和發展都十分迅速,該技術在信息管理、企業管理、電子政務、金融、制造、科研、教育、能源等各個領域的發展與變革中都發揮出了顯著優勢。以下是大數據技術在我國幾個典型領域的應用現狀的分析。
所謂工業物聯網,就是在工業生產過程中所涉及的產品、設備等各項數據的采集和管理。通常情況下,其數據管理采用遠程管理形式,如設備的歷史數據處理、運行狀態監控等。而在工業生產設備長期運行監控過程中,獲取的大量數據則是對工業生產企業進行產能分析、設備故障發生概率以及產品合格率檢測等主要信息來源。因這些數據十分龐大,我們就將其稱為工業大數據。在對工業大數據進行采集、預處理、挖掘、分析和儲存的過程中,一方面需要通過專業化平臺進行分析、儲存與展現;另一方面則需要借助于大數據技術中的數據驅動技術進行各種設備故障的檢測,以此實現工業生產設備的合理優化。
網絡信息時代,人們會將大多數閑暇時間花在手機上,在這樣的情況下,各種基于手機客戶端的視頻平臺、音樂平臺、咨詢平臺以及購物平臺等相繼出現。比如,在手機購物平臺的應用中,人們進行商品選擇就像是對“消費者數據填空題”進行的回答,借助大數據技術中的數據挖掘技術,平臺能夠總結出用戶的購物類型,當用戶下一次登錄該購物平臺時,平臺終端會根據用戶之前購買的商品進行類似商品推送。同樣的,在其他平臺的應用中,借助于數據挖掘技術,也可以挖掘并記錄下用戶的習慣,以此實現相關信息的推送。由此可見,大數據技術中的數據挖掘技術可通過用戶對相應平臺的應用習慣進行用戶“畫像”,以此實現對用戶年齡、性格、愛好以及消費等級等各項信息的推斷。另外,運用數據挖掘技術也可以對用戶的人口屬性、興趣特征、資產情況、消費特征、常駐城市以及位置特征等進行科學推斷,讓用戶畫像更加具體[4]。
隨著智能醫療的不斷發展,其應用逐漸擴展至診療活動的各個環節,以此不僅提升了診療、管理的質量效率,還可促進了區域醫療資源的優化整合。以精準醫療為例,作為一項新型診療技術,精準醫療通過人類基因測序技術,依托大數據技術探究個體蛋白質組、基因組與相關疾病之間的聯系,精確定位相關疾病的發病機制,進一步獲得精準治療靶點,評估重大缺陷性疾病。和傳統治療手段相比,精準醫療既精確又高效便捷,并可極大減少對患者的創傷,對已確診和未確診的治療及防御均具備十分重要的臨床價值。現階段,精準醫療在腫瘤、遺傳病、婦科等領域得到廣泛推廣。
在科學技術發展與教育改革深化的過程中,大數據技術在教育領域發揮的作用日益顯著。目前來看,大數據技術在我國教育領域的應用主要分為3個方面:第一是在適應性教學中的應用,第二是在教學規律發現中的應用,第三是在校園信息化管理中的應用。比如,運用基于大數據技術的Learnsprout系統,可對高考備考進行科學評價,及時發現學生學習過程中的問題所在,通過早期干預的方式來解決學生的學習問題,并根據實際情況提供輔助,這樣可有效提升學生的學習效率與質量。大數據技術與應用實驗室配置。由于我國的院校目前申請大數據技術與應用才剛剛經過三年,因此,在教學中教學基礎設施的配置、軟硬件設施的資源都不是很到位。有些各大學院在大數據實驗室的建立上正處在籌備階段,或是剛剛獲得相關部門批準。盡管如此,大部分的高校還是缺少可以讓學生實際參與的實踐案例及大數據發展行業的數據,使得學生直接受到了理論知識的灌輸,而沒有辦法進行實際的操作。如果理論和實際無法相結合,將會導致所培養的學生在畢業時無法找到合適的行業就業,也沒有辦法達到市場對大數據人才的需求。因此,這將對各大院校大數據技術運用專業人才培養適應社會需求產生了極大的挑戰[5]。
隨著社會經濟的不斷發展,各種先進科技不斷被引入至城市化發展中,其中大數據技術便在智能建筑中得到應用,為智能建筑發展提供了可靠技術支持。首先,面對近年來城市中不斷增多的高層建筑,如果采用以往的消防技術必然會帶來一系列不利影響,由于樓層較高,加之發生火災時無法使用電梯,這便很大程度上加大了消防工作的難度。而在如今的智能建筑中,這些問題均得到了有效解決,通過應用大數據技術可在高層建筑設計時在相應區域安裝消防噴淋頭,一旦發生火災,可保證及時實現滅火效果。并且消防噴淋頭還可實現攝像功能,通過對現場情況進行監控,為消防人員提供現場數據,進而實現對火災的有效防范。其次,還可將大數據技術應用于智能建筑中的溫度調節系統。相關技術人員可通過智能技術對建筑的溫濕度進行調節,同時通過大數據技術可監測區域的人員情況,依托模型建立匹配,然后對數據信息開展分析,獲取室內溫度的最佳數值,對區域溫度開展調節,以此為居住者創造良好的居住環境,顯著提升人們的居住體驗。
在生態系統中涉及的大數據主要包括植被、土壤、海洋以及大氣等各種生態數據。這些數據不僅具有非常龐大的信息量,而且信息類型十分復雜,傳統形式的數據分析和處理技術并不能有效滿足實際的分析與處理需求,而通過大數據技術的合理應用,便可實現各項生態系統數據信息的分析與處理。比如,在氣象觀測中,將大數據技術應用到大氣數據分析與可視化系統中,便可通過數據分析系統和數據處理算法的科學結合實現對氣象數據的精準分析和處理。近年來,生態退化的表現越來越突出,相關的問題也在快速擴散,森林與土地的退化對生物多樣性造成了不良的影響,而水資源的退化則直接影響到了人們的生活。生態系統是一個循環性的體系,而生態退化問題的發生也并不是一蹴而就的,而是在多種因素共同影響的作用下發生的復雜反應,是量變逐漸積累、最終形成質變的結果。在對這一問題進行完善的過程中,除了需要運用生態學、環境學的知識之外,還需要了解生物學、地質學等方面的內容。
2019年的新冠肺炎疫情得到充分證明。這種全國性、全球性使城市公共衛生事件的輿情通過互聯網延伸到全球任何一個角落,大數據發揮出了特別大的優點。首先,疫情防控期間每天各地方感染者數據公開,政府此番舉動讓人民及時了解到新冠疫情感染性極強,提高了人民對于新冠疫情的重視程度,從而讓疫情得到了有效控制。從每天感染者數字的增加到最后治愈人數的增加,降低了人民的恐懼感。大數據技術帶來了網絡輿情引導的精準化。通過基于大數據技術的健康碼、行程碼等數據的精準分析,為城市攜起手來共同應對公共衛生事件,為城市、國家和全球的安全與安寧作出歷史性貢獻。其次,疫情防控期間需要注冊健康碼,只有綠碼才能正常通行,通過掃描防疫大數據碼可查詢到活動軌跡,去過高風險地區或者健康碼呈現紅色和橙色需要隔離,這也是疫情得到快速控制的主要因素之一。
任何事情都具有兩面性,有利必有弊,大數據的弊主要體現在誤導網絡輿情及數據的泄露。首先,在經濟全球化的今天,重大突發公共衛生事件處理不好,就可能發展成為影響政治、經濟、社會穩定和外交的重大問題。過去那種家丑不可外揚的觀念,在今天的信息時代一定要改變。疫情是捂不住的,延誤時機只能使自己被動,這個教訓是深刻的。”實際上,在網絡輿情引導中,網絡輿情混亂很多都是源自政府信息不公開。少數城市政府知情而說謊,公眾不知情而造謠,網民傳播網絡輿情就越混亂。再如在2019年12月發生的新冠病毒肺炎疫情中,同樣發生了壓制網絡輿情現象,吹哨人李文亮等8位醫生最先發布的信息被隱瞞,以致出現了“萬家宴”等本可避免的悲劇,這給網絡輿情引導及疫情防控埋下后患。當公共衛生事件沒有控制住時,來自全球各地的多個不利網絡輿情疊加時,公眾必然極度恐慌。其次,數據泄露的例子比比皆是,人們經常會接收到各種推銷電話和騷擾信息,這可能是人們無意中的泄露甚至也可能是不法分子進行的數據買賣。數據買賣往小了說侵犯個人的隱私,往大了說可能危害國家利益。對于國家來說,大數據不斷積累,有可能發生從量變到質變。最終會對國家帶來危害,隨著數據的積累,可能現在用處不大的數據對將來的研究會產生重要的影響,也會出現隱患。因此,要確保無用數據的處理不留痕跡。
綜上所述,在今后的工作中,要加大監督力度嚴格把關數據應用的隱秘性,同時加大對數據保護高層次人才培養,對國家核心數據要進行嚴格保護,要區分好涉密數據,充分發揮大數據技術的應用優勢,推進對大數據技術的科學合理應用,為現代社會發展進步貢獻一份力。