文/黃靖
一直受到業(yè)界關(guān)注的大數(shù)據(jù)技術(shù),沒有辜負(fù)人們的期待高速發(fā)展,并被廣泛的運(yùn)用到很多領(lǐng)域、行業(yè)、乃至民眾個(gè)人生活中。本文從新的視角闡述大數(shù)據(jù)釋義與功能,解析我國大數(shù)據(jù)技術(shù)發(fā)展的最有利因素和潛在困惑,探討政策和技術(shù)如何協(xié)同引領(lǐng)發(fā)展。
對(duì)大數(shù)據(jù)的理解是仁者見仁、智者見智,孟小峰、慈祥認(rèn)為“對(duì)于大數(shù)據(jù)尚未有一個(gè)公認(rèn)的定義,不同的定義基本是從大數(shù)據(jù)的特征出發(fā),通過這些特征的闡述和歸納試圖給出其定義”。謝中起認(rèn)為“大數(shù)據(jù)不是數(shù)據(jù)量的簡單刻畫,也不是特定算法、技術(shù)或商業(yè)模式上的發(fā)展,而是從數(shù)據(jù)量、數(shù)據(jù)形態(tài)和數(shù)據(jù)分析處理方式到理念和形態(tài)上重大變革的總和”。其實(shí)我們轉(zhuǎn)化視角,可從四個(gè)方面進(jìn)行深入的理解和把握。
盡管人們對(duì)數(shù)據(jù)或許會(huì)有不同的認(rèn)知和理解,但有一點(diǎn)是可肯定的,數(shù)據(jù)是機(jī)器或其它主體對(duì)標(biāo)的物測(cè)量或觀察的結(jié)果及記錄,是對(duì)客觀標(biāo)的數(shù)理歸納,數(shù)據(jù)可以是連續(xù)地記錄數(shù)值,包括聲音、圖像等模擬數(shù)據(jù);也可以是離散的數(shù)值,像文字、符號(hào)等之類字符值(數(shù)字?jǐn)?shù)據(jù))。我們用科學(xué)的理性邏輯,從整體功能的視角去研究大數(shù)據(jù),它有廣義和狹義之分。前者指從物理界到數(shù)字界的映射和提煉。通過發(fā)現(xiàn)其數(shù)值特征,從而做出提升效率的決策行為。后者通常是由IT 行業(yè)給出釋義,即通過獲取、存儲(chǔ)、分析,從大容量數(shù)據(jù)中挖掘價(jià)值的一種全新的技術(shù)架構(gòu)。只有當(dāng)數(shù)據(jù)的測(cè)量或觀察值聚集成海量,經(jīng)過分析、歸納等技術(shù)處理才成為大數(shù)據(jù),再通過有關(guān)系統(tǒng)整合成為支持決策的工具時(shí),這才更具有使用價(jià)值。
在現(xiàn)在信息系統(tǒng)中,大數(shù)據(jù)成海量狀態(tài),它所采集、存儲(chǔ)和計(jì)算的數(shù)據(jù)量超大,以突破1ZP 的數(shù)量級(jí),這種數(shù)據(jù)存儲(chǔ)形式相當(dāng)于傳統(tǒng)數(shù)據(jù)儲(chǔ)存形式的幾何式翻倍。其數(shù)據(jù)結(jié)構(gòu)成具有多樣性,大數(shù)據(jù)的組成并不是單一的、固定的模式,其內(nèi)容一般包括文本信息、網(wǎng)頁框架以及圖像等內(nèi)容。即便如此,系統(tǒng)中數(shù)據(jù)運(yùn)行依然高效,包括數(shù)據(jù)生成,存儲(chǔ),分析和移動(dòng)等。數(shù)據(jù)的實(shí)時(shí)性有助于決策者及時(shí)決策。且系統(tǒng)中數(shù)據(jù)價(jià)值密度低,數(shù)據(jù)存儲(chǔ)量大,創(chuàng)造的價(jià)值高。
在大數(shù)據(jù)的體系分析中衍生出兩個(gè)重要概念,即維度與指標(biāo),使大數(shù)據(jù)分析變得更有意義。維度是指可指定不同值的對(duì)象的描述性屬性或特征,維度用來解析數(shù)據(jù)。指標(biāo)是指可以按總數(shù)或比值衡量的具體維度元素,指標(biāo)用來計(jì)量數(shù)據(jù)。維度和指標(biāo)之間關(guān)聯(lián)度高,盡管維度和指標(biāo)均可單獨(dú)運(yùn)用,但在大數(shù)據(jù)分析和處理過程中相互結(jié)合運(yùn)用。維度值和指標(biāo)值、尤其是兩者之間的數(shù)值關(guān)聯(lián),才讓人們都懂其中的內(nèi)在含義。為了挖掘潛在的、深層次的更具價(jià)值的信息,維度與一個(gè)或多個(gè)指標(biāo)關(guān)聯(lián)在一起運(yùn)用,以有助于豐富大數(shù)據(jù)的內(nèi)涵,增添信息潛在功能,提升其運(yùn)用的價(jià)值。
伴隨著科學(xué)技術(shù)的發(fā)展,互聯(lián)網(wǎng)、云計(jì)算、人工智能、區(qū)塊鏈等新興技術(shù)的崛起,分布式處理技術(shù)、存儲(chǔ)技術(shù)和感知技術(shù)的不斷改進(jìn)和完善,應(yīng)用功能不斷增強(qiáng)。比如大數(shù)據(jù)金融的作用被不斷強(qiáng)化,從應(yīng)用于金融戰(zhàn)略布局、整體風(fēng)險(xiǎn)防控,再到解決營業(yè)窗口柜面、及個(gè)人優(yōu)質(zhì)服務(wù),其解決方案層出不窮。此外,大數(shù)據(jù)從采集、處理、存儲(chǔ)、應(yīng)用全過程與傳統(tǒng)信息數(shù)據(jù)集合相比,在社會(huì)的各個(gè)領(lǐng)域,產(chǎn)業(yè)的各個(gè)行業(yè),經(jīng)濟(jì)的各個(gè)方面都可運(yùn)用,除指標(biāo)、數(shù)值、具體運(yùn)作差異外,其基本原理、內(nèi)在邏輯,解決問題的思路基本是一致的,因此也具有更大的適用范圍和應(yīng)用效能。
現(xiàn)在大數(shù)據(jù)在我國不僅已成為社會(huì)和生產(chǎn)資源,而且在政策和技術(shù)的支撐下發(fā)展成新興產(chǎn)業(yè)。繼續(xù)發(fā)展既有有利因素,也有潛在困惑,縷清頭緒、便于改進(jìn)。
2.1.1 國家高度重視大數(shù)據(jù)戰(zhàn)略
2014年“大數(shù)據(jù)”被首次寫入政府工作報(bào)告,表明國家高度關(guān)注它,并不斷推出新的舉措,研究國家層面的發(fā)展規(guī)劃,制定行動(dòng)綱要,進(jìn)行頂層設(shè)計(jì),相繼出臺(tái)了一系列政策。譬如《促進(jìn)大數(shù)據(jù)發(fā)展的行動(dòng)綱要》,《大數(shù)據(jù)產(chǎn)業(yè)發(fā)展規(guī)劃(2016-2020年)》,從宏觀上對(duì)大數(shù)據(jù)發(fā)展進(jìn)行頂層設(shè)計(jì)、統(tǒng)籌布局,配套推進(jìn)國家大數(shù)據(jù)戰(zhàn)略。
2.1.2 大數(shù)據(jù)產(chǎn)業(yè)體系逐步壯大
2015年我國大數(shù)據(jù)產(chǎn)業(yè)收入2800 億元,2017年大數(shù)產(chǎn)業(yè)收入4700 億元,同比增長30%;2018-2020年增速會(huì)保持在30%以上。跨地區(qū)大型數(shù)據(jù)中心(IDC)現(xiàn)已超過300 家,云計(jì)算平臺(tái)的數(shù)據(jù)處理能力已躋身世界前列,上下游企業(yè)聯(lián)動(dòng)格局正在形成。大數(shù)據(jù)技術(shù)、產(chǎn)業(yè)與服務(wù)成為資本關(guān)注的熱點(diǎn),大數(shù)據(jù)產(chǎn)業(yè)體系的壯大會(huì)進(jìn)一步促進(jìn)經(jīng)濟(jì)的繁榮。
2.1.3 大數(shù)據(jù)技術(shù)體系初步形成
由于政策體系的支持,科研機(jī)構(gòu)、企業(yè)等相關(guān)組織的積極配合,大數(shù)據(jù)技術(shù)在我國有了長足發(fā)展,2018年我國大數(shù)據(jù)領(lǐng)域公開的專利約占全球的40%,居世界發(fā)展前列。一批大數(shù)據(jù)技術(shù)研發(fā)實(shí)驗(yàn)室、技術(shù)中心、數(shù)據(jù)平臺(tái)、投資基金等形式的支撐平臺(tái)相繼建立。大數(shù)據(jù)技術(shù)應(yīng)用已從起始的電信業(yè)、金融業(yè)向政務(wù)、衛(wèi)健、工業(yè)、科技等領(lǐng)域延伸。有些方面還處于國際領(lǐng)先水平。
2.1.4 大數(shù)據(jù)優(yōu)秀企業(yè)市場(chǎng)競(jìng)爭(zhēng)力日益增強(qiáng)
我國大數(shù)據(jù)產(chǎn)業(yè)鏈進(jìn)一步完善,企業(yè)技術(shù)水平不斷提升。在數(shù)據(jù)采集、存儲(chǔ)、分析、安全與可視化等領(lǐng)域均成長起一批優(yōu)秀企業(yè),例如阿里巴巴、化為、浪潮、騰訊、中興通訊等現(xiàn)代企業(yè)。由于在技術(shù)研發(fā)和市場(chǎng)開發(fā)均取得成功,在國際市場(chǎng)都有很強(qiáng)的競(jìng)爭(zhēng)力,成為國內(nèi)企業(yè)發(fā)展大數(shù)據(jù)技術(shù)的榜樣。
2.2.1 缺少支持大數(shù)據(jù)發(fā)展含金量高的政策
因?yàn)榇髷?shù)據(jù)技術(shù)研發(fā)和運(yùn)用不僅需要產(chǎn)業(yè)資本的支持,也需要政策資金的引導(dǎo)。例如大數(shù)據(jù)處理中心建設(shè)、大數(shù)據(jù)核心技術(shù)研發(fā)、綜合信息平臺(tái)的建立,都需要聚焦產(chǎn)業(yè)和社會(huì)資本的鼎力支持。而目前,業(yè)內(nèi)大數(shù)據(jù)企業(yè)普遍存在資本短缺、社會(huì)融資能力不強(qiáng)的問題,國家政策在這方面相對(duì)較為薄弱,資金短缺成為相關(guān)企業(yè)發(fā)展的瓶頸。
2.2.2 很多大數(shù)據(jù)尚未找到業(yè)務(wù)應(yīng)用的突破口
發(fā)展大數(shù)據(jù)技術(shù)是要作為技術(shù)工具或方法要應(yīng)用到具體領(lǐng)域和業(yè)務(wù)中去,支撐產(chǎn)業(yè)發(fā)展、服務(wù)社會(huì)民眾。大數(shù)據(jù)技術(shù)研發(fā)和應(yīng)用是一個(gè)長期復(fù)雜過程,稍有不當(dāng)或誤差都會(huì)影響成敗,不是說做幾個(gè)SAAS 軟件或RAAS 軟件就是大數(shù)據(jù)了,還需要組織專門的技術(shù)人才、配備專業(yè)的研發(fā)設(shè)施,進(jìn)行科學(xué)、有針對(duì)性的研發(fā),才能找準(zhǔn)突破口,支持有關(guān)業(yè)務(wù)做大做強(qiáng)。
2.2.3 很多數(shù)據(jù)有待開發(fā)、或開發(fā)無序
我國普遍未形成成型的數(shù)據(jù)采集、加工、分析和應(yīng)用鏈條,擁有大數(shù)據(jù)也未必可實(shí)現(xiàn)其價(jià)值。比如,醫(yī)療健康行業(yè)收集了大量數(shù)據(jù),并沒有找到合適的應(yīng)用和實(shí)現(xiàn)價(jià)值的方法或渠道。我國的政府、公共服務(wù)、農(nóng)業(yè)應(yīng)用基本缺位,有些行業(yè)內(nèi)數(shù)據(jù)缺少外部的補(bǔ)充。很多機(jī)構(gòu)或企業(yè)期望用大量零碎數(shù)據(jù)去交易,能有多大價(jià)值也很難考量。其實(shí)很多數(shù)據(jù)本身存在錯(cuò)誤、噪音等問題。
2.2.4 產(chǎn)業(yè)和民生大數(shù)據(jù)共享、開放度低
從大數(shù)據(jù)本身而言,有些不可共享、開放的。但是涉及到產(chǎn)業(yè)發(fā)展、特別是服務(wù)民生的應(yīng)提倡共享、開放。因?yàn)閿?shù)據(jù)壁壘會(huì)極大降低大數(shù)據(jù)資源配置效率。其重要原因是受制于前期基礎(chǔ)設(shè)施建設(shè)和研發(fā)資金投入,這也是業(yè)界常說的“數(shù)據(jù)孤島”問題,不僅數(shù)據(jù)價(jià)值難以發(fā)揮,甚至出現(xiàn)“數(shù)據(jù)劣幣驅(qū)逐良幣”現(xiàn)象。如果數(shù)據(jù)不能共享、開放,何談?wù)稀⒎?wù)產(chǎn)業(yè)和社會(huì)。
從大數(shù)據(jù)發(fā)展戰(zhàn)略出發(fā),國家科學(xué)技術(shù)的發(fā)展?jié)摿εc它擁有數(shù)據(jù)規(guī)模、信息體系、運(yùn)用效率、以及掌控?cái)?shù)據(jù)的能力密不可分。所以,加大國家政策、技術(shù)的協(xié)同引領(lǐng)大數(shù)據(jù)的發(fā)展刻不容緩。
各級(jí)政府組織作為國家科技發(fā)展的主導(dǎo)力量,應(yīng)設(shè)法運(yùn)用政策和制度來推進(jìn)科研、高校、行協(xié)、企業(yè)、用戶協(xié)同配合,聯(lián)合攻關(guān),突破大數(shù)據(jù)發(fā)展的關(guān)鍵技術(shù)瓶頸。包括大數(shù)據(jù)供給層面的區(qū)塊鏈技、數(shù)據(jù)交換技術(shù),數(shù)據(jù)處理層面的大數(shù)據(jù)存儲(chǔ)管理、新興計(jì)算技術(shù),數(shù)據(jù)分析層面的大數(shù)據(jù)基礎(chǔ)算法、機(jī)器學(xué)習(xí)、智能技術(shù),大數(shù)據(jù)應(yīng)用層面的大數(shù)據(jù)可視化、真?zhèn)闻卸夹g(shù)。加強(qiáng)大數(shù)據(jù)基礎(chǔ)問題研究,圍繞大數(shù)據(jù)理論體系、大數(shù)據(jù)計(jì)算系統(tǒng)與分析理論、大數(shù)據(jù)驅(qū)動(dòng)的顛覆性應(yīng)用等重大基礎(chǔ)研究進(jìn)行前瞻布局。以加強(qiáng)技術(shù)的綜合應(yīng)用,推動(dòng)互聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能同實(shí)體經(jīng)濟(jì)深度融合。
大數(shù)據(jù)發(fā)展戰(zhàn)略關(guān)乎我國在世界的影響力和競(jìng)爭(zhēng)力,必須強(qiáng)化政府的強(qiáng)大力量,讓政府政策投資引導(dǎo)企業(yè)、社會(huì)投資于大數(shù)據(jù)基礎(chǔ)設(shè)施、基礎(chǔ)技術(shù)、戰(zhàn)略技術(shù),并且為鼓勵(lì)企業(yè)和社會(huì)各界投資于大數(shù)據(jù)的核心領(lǐng)域和重點(diǎn)技術(shù)給予政策引導(dǎo)和資金支持。比如對(duì)于符合國家支持大數(shù)據(jù)政策的項(xiàng)目,社會(huì)共享的信息系統(tǒng)或者信息平臺(tái)的投資者,國家有關(guān)管理部門可采取資金補(bǔ)貼,降稅減費(fèi)的方法以于支持。以資鼓勵(lì)龍頭企業(yè)提升大數(shù)據(jù)核心競(jìng)爭(zhēng)力,夯實(shí)大數(shù)據(jù)發(fā)展的基礎(chǔ),引導(dǎo)中小企業(yè)內(nèi)籌外引投資,讓大數(shù)據(jù)企業(yè)走內(nèi)外兼修的發(fā)展道路,加快大數(shù)據(jù)國際化發(fā)展步伐。
改進(jìn)和完善國家支持大數(shù)據(jù)技術(shù)發(fā)展的政策,切實(shí)增強(qiáng)其政策體系含金量,加大政策與技術(shù)共振力度,著力深化大數(shù)據(jù)行業(yè)應(yīng)用。當(dāng)前大數(shù)據(jù)行業(yè)中的應(yīng)用主要表現(xiàn)在數(shù)據(jù)處理、用戶畫像以及企業(yè)管理效率優(yōu)化等方面,下一步應(yīng)重點(diǎn)推動(dòng)大數(shù)據(jù)在更深層次與實(shí)體經(jīng)濟(jì)的融合,協(xié)同改進(jìn)大數(shù)據(jù)、云計(jì)算、物聯(lián)網(wǎng)相關(guān)產(chǎn)業(yè),形成聯(lián)動(dòng)發(fā)展機(jī)制,鼓勵(lì)大數(shù)據(jù)企業(yè)不斷提升大數(shù)據(jù)平臺(tái)和應(yīng)用的可適性和便捷性,優(yōu)先支持面向各應(yīng)用行業(yè)的產(chǎn)品,服務(wù)和解決方案的開發(fā),簡化大數(shù)據(jù)底層繁瑣復(fù)雜的技術(shù),推動(dòng)大數(shù)據(jù)行業(yè)聯(lián)動(dòng)。達(dá)到頂層規(guī)劃與具體支持措施并舉。
運(yùn)用大數(shù)據(jù)解決的問題通常涉及多部門、多領(lǐng)域、多個(gè)體、多視角,單一的行業(yè)、單純的數(shù)據(jù)量積累很難全面讓人們認(rèn)識(shí)事物的整體全貌,掌握其運(yùn)行規(guī)律。只有將不同側(cè)面、不同局部的數(shù)據(jù)匯聚起來并加以關(guān)聯(lián),才能產(chǎn)生對(duì)事物的整體性和本質(zhì)性的認(rèn)識(shí)。科學(xué)匯聚數(shù)據(jù)方可挖掘價(jià)值,數(shù)據(jù)關(guān)聯(lián)使數(shù)據(jù)實(shí)現(xiàn)價(jià)值。因此,必須推動(dòng)數(shù)據(jù)共享、開放。政府、企業(yè)是大數(shù)據(jù)的主要擁有者。要推動(dòng)大數(shù)據(jù)轉(zhuǎn)化為發(fā)展動(dòng)能,就要保障數(shù)據(jù)供給和合理合法的共享應(yīng)用,服務(wù)我國產(chǎn)業(yè)和社會(huì)民眾。