唐俊林
(貴州師范大學(xué)大數(shù)據(jù)與計(jì)算機(jī)科學(xué)學(xué)院貴州貴陽(yáng) 550001)
大數(shù)據(jù)是指通過(guò)傳統(tǒng)技術(shù)手段難以有效獲取、存儲(chǔ)、管理和分析能力的數(shù)據(jù)集。國(guó)際數(shù)據(jù)公司用四個(gè)維度的特征來(lái)定義大數(shù)據(jù),即數(shù)據(jù)集的規(guī)模、數(shù)據(jù)流動(dòng)的速度、數(shù)據(jù)類(lèi)型的多少和數(shù)據(jù)價(jià)值的大小[1]來(lái)進(jìn)行判別。
大數(shù)據(jù)概念的提出催生了大量新技術(shù)的提出與發(fā)展,目前,大數(shù)據(jù)涉及到的關(guān)鍵技術(shù)主要包括:大數(shù)據(jù)采集技術(shù)、大數(shù)據(jù)預(yù)處理技術(shù)、大數(shù)據(jù)存儲(chǔ)與管理技術(shù)、大數(shù)據(jù)安全技術(shù)和大數(shù)據(jù)挖掘技術(shù),其中,大數(shù)據(jù)挖掘技術(shù)是技術(shù)的最終需求,是大數(shù)據(jù)主要的目的,通過(guò)數(shù)據(jù)挖掘技術(shù),可以對(duì)被監(jiān)控對(duì)象進(jìn)行預(yù)測(cè)、估計(jì)與健康管理。
基于大數(shù)據(jù)技術(shù)的廣泛適用性,許多國(guó)家已經(jīng)將其與人工智能技術(shù)一起提升到國(guó)家戰(zhàn)略層面。中國(guó)、美國(guó)、英國(guó),德國(guó)和日本等國(guó)家都相繼提出了想過(guò)政策來(lái)支持對(duì)大數(shù)據(jù)技術(shù)的研究和應(yīng)用。
目前,大數(shù)據(jù)技術(shù)發(fā)展迅猛,相關(guān)技術(shù)已經(jīng)應(yīng)用在能源、教育、科研、制造、金融、電子政務(wù)、企業(yè)經(jīng)營(yíng)管理、信息管理等領(lǐng)域,為這些領(lǐng)域賦能與變革[2]。
工業(yè)物聯(lián)網(wǎng)顧名思義是指將工業(yè)生產(chǎn)中涉及的設(shè)備、已服役的產(chǎn)品等進(jìn)行數(shù)據(jù)的采集與管理。其中數(shù)據(jù)的管理一般是遠(yuǎn)程的形式,包括設(shè)備的運(yùn)行狀態(tài)監(jiān)控以及設(shè)備歷史數(shù)據(jù)的處理。設(shè)備長(zhǎng)時(shí)間運(yùn)行所捕獲到的大量數(shù)據(jù)正是工廠分析產(chǎn)能,獲取設(shè)備故障率、產(chǎn)品合格率等信息的來(lái)源。大量的數(shù)據(jù),即工業(yè)大數(shù)據(jù)需要借助大數(shù)據(jù)技術(shù)進(jìn)行采集、存儲(chǔ)、預(yù)處理、分析、挖掘等。這些數(shù)據(jù)一方面需要用專(zhuān)業(yè)的平臺(tái)來(lái)存儲(chǔ)、分析和展現(xiàn),另一方面要通過(guò)數(shù)據(jù)驅(qū)動(dòng)技術(shù),實(shí)現(xiàn)對(duì)設(shè)備的故障預(yù)測(cè)、健康診斷和優(yōu)化等。
濰柴公司利用工業(yè)大數(shù)據(jù)技術(shù)實(shí)現(xiàn)了工程機(jī)械的定位和遠(yuǎn)程監(jiān)控服務(wù),包括工作時(shí)長(zhǎng)計(jì)算、故障預(yù)警等服務(wù);上海隧道工程公司與北方重工公司通過(guò)與高校合作均實(shí)現(xiàn)了盾構(gòu)機(jī)掘進(jìn)過(guò)程中的故障預(yù)警;美的集團(tuán)建立了空調(diào)生產(chǎn)車(chē)間的DigitalTwin,可以對(duì)設(shè)備狀態(tài)實(shí)時(shí)監(jiān)控。此外,工業(yè)大數(shù)據(jù)還可應(yīng)用于對(duì)鋼鐵和風(fēng)電等行業(yè)的設(shè)備監(jiān)控和能耗分析等。
隨著移動(dòng)互聯(lián)網(wǎng)的發(fā)展,人們?cè)谑謾C(jī)上的耗時(shí)越來(lái)越多,購(gòu)物平臺(tái),資訊平臺(tái)、音樂(lè)與視頻平臺(tái)等層出不窮。以購(gòu)物為例,人們?cè)谔暨x商品的時(shí)候,實(shí)則是為消費(fèi)數(shù)據(jù)填空,在下次登錄時(shí)該應(yīng)用終端都會(huì)推送類(lèi)似的事物。這就是大數(shù)據(jù)的作用,一旦采集到用戶(hù)在購(gòu)物、新聞、搜索、音視頻等平臺(tái)的使用數(shù)據(jù),通過(guò)挖掘技術(shù)就可以得出用戶(hù)的“畫(huà)像”,可以推斷出用戶(hù)的性格,年齡,消費(fèi)等級(jí)等信息。
大數(shù)據(jù)可以分析出的數(shù)據(jù)包括人口屬性、資產(chǎn)情況、興趣特征、消費(fèi)特征、位置特征、常駐城市等。
大數(shù)據(jù)的分析和挖掘技術(shù)的運(yùn)用可以在一定程度上幫助醫(yī)療行業(yè)提高生產(chǎn)力,改進(jìn)護(hù)理水平,增強(qiáng)競(jìng)爭(zhēng)力。表現(xiàn)在:
(1)利用大數(shù)據(jù)技術(shù)可以將各種疾病進(jìn)行分類(lèi)總結(jié),形成專(zhuān)家?guī)欤瑥亩岣哚t(yī)務(wù)人員的效率,降低病人的看病成本和身體損害;
(2)利用大數(shù)據(jù)還可以實(shí)現(xiàn)醫(yī)生對(duì)病人的遠(yuǎn)程監(jiān)控,從而減少病人的住院,省時(shí)省地,實(shí)現(xiàn)醫(yī)療資源的最優(yōu)化配置。
生態(tài)系統(tǒng)涉及到的數(shù)據(jù)囊括了大氣、海洋、土壤、植被等生態(tài)數(shù)據(jù);數(shù)據(jù)構(gòu)成上多樣復(fù)雜,龐大,分析起來(lái)不便,借助大數(shù)據(jù)技術(shù)進(jìn)行存儲(chǔ)和分析就可以滿(mǎn)足需求[3]。
以人們感受頗多的天氣預(yù)報(bào)為例,目前氣象觀測(cè)己經(jīng)由過(guò)去相對(duì)的標(biāo)準(zhǔn)、預(yù)測(cè)范圍籠統(tǒng)發(fā)展到如今海量的非常規(guī)觀測(cè),觀測(cè)精度和定義指標(biāo)也日益提高[4]。黃剛等分析了大氣科學(xué)數(shù)據(jù)的特點(diǎn),構(gòu)建了一套新的大氣科學(xué)數(shù)據(jù)的分析和可視化系統(tǒng),并提出數(shù)據(jù)處理算法與數(shù)據(jù)分析系統(tǒng)結(jié)合的可行方案[5]。
大數(shù)據(jù)在教育中的應(yīng)用主要體現(xiàn)在適應(yīng)性教學(xué)、教學(xué)規(guī)律發(fā)現(xiàn)以及校園信息化管理三個(gè)方面。
Learnsprout系統(tǒng)能夠?qū)鋺?zhàn)高考的學(xué)術(shù)進(jìn)行評(píng)價(jià),對(duì)存在問(wèn)題的學(xué)生進(jìn)行早期干預(yù),以輔助學(xué)術(shù)發(fā)現(xiàn)問(wèn)題及時(shí)更改,取得了很好的效果[5]。
目前,深度學(xué)習(xí)已經(jīng)圖像分類(lèi)、語(yǔ)音識(shí)別和自然語(yǔ)言理解中得到了廣泛應(yīng)用,并已初步市場(chǎng)化。隨著計(jì)算機(jī)硬件計(jì)算能力的提升以及人們對(duì)事物精確程度的要求,大數(shù)據(jù)技術(shù)的應(yīng)用越來(lái)越向多樣化數(shù)據(jù)融合的方向發(fā)展,中國(guó)綜合分析達(dá)到更精準(zhǔn)的效果。
數(shù)據(jù)的采集是極為繁重的一件事,不同行業(yè)公司都有自己專(zhuān)屬的一些數(shù)據(jù),這些數(shù)據(jù)的分享必將加速大數(shù)據(jù)的應(yīng)用。目前開(kāi)放平臺(tái)和開(kāi)源平臺(tái)受到了百度、騰訊、阿里和科大訊飛等公司的推崇,而且這種趨勢(shì)似乎可能會(huì)持續(xù)下去。開(kāi)源平臺(tái)趨勢(shì)也將改進(jìn)大數(shù)據(jù)處理的方式。
邊緣計(jì)算可以減少企業(yè)的網(wǎng)絡(luò)數(shù)據(jù)流量,提高性能,節(jié)省云計(jì)算成本。此外,邊緣計(jì)算還可以加快分析過(guò)程,使決策者能夠比以前更快地采取行動(dòng)。也是大數(shù)據(jù)技術(shù)發(fā)展的一個(gè)趨勢(shì)。
本文首先對(duì)大數(shù)據(jù)技術(shù)的概念與關(guān)鍵技術(shù)進(jìn)行了闡述,并以案例的形式對(duì)大數(shù)據(jù)在工業(yè)、用戶(hù)畫(huà)像、醫(yī)療、教育、生態(tài)環(huán)境等方面的應(yīng)用進(jìn)行了闡述。最后通過(guò)對(duì)關(guān)鍵技術(shù)的分析得出了大數(shù)據(jù)技術(shù)由單一分析轉(zhuǎn)向多樣融合分析,由數(shù)據(jù)封閉轉(zhuǎn)向開(kāi)源、共享以及由云計(jì)算轉(zhuǎn)向邊緣計(jì)算的趨勢(shì)。