□ 張 虹,肖 強
(1.南京郵電大學 管理學院,江蘇 南京 210023;2.中國電信江蘇分公司,江蘇 南京 210000)
2008年8月,全球聞名的咨詢公司麥肯錫,首次提出了“大數據”(big data)的定義,大數據又稱巨量數據或海量數據,從字面意思來看,其大小非常的龐大,從功能上遠遠超過了典型數據庫軟件的收集、存儲、管理分析等能力。大數據作為一種新型的生產要素,具有規模大、流通快、類型多和價值密度低這四個顯著的特征。運用在物理、生物、環境生態、軍事、金融和通信領域的大數據早已存在,人們也逐漸習慣大數據常規的使用方式,但在2013年移動互聯網變革的大爆發使得云計算技術與大數據充分結合起來,擦出了不一樣的火花,引起了各行各業人們的關注和研究。時間的巨輪還在遠航,科學技術的進步還在繼續推進,2017年,機器學習和人工智能逐漸深入到社會的各個角落,大數據時代終于登上了歷史舞臺。大數據時代主要以信息時代為根本的,透過互聯網途徑,大量收集數據資源,進而存儲和提取可以有效地為人們管理多量的數據,讓所有人都可以從數據中獲取所需要的信息,包括事物內部的規律信息以及數據表現出來的知識價值。在瘋狂的大數據時代,大數據已經不僅僅是單純的數據,而是一種思維和方法,即以海量數據作為基礎,通過數據挖掘、分析和應用等方法來獲取事物的價值,從而達到智能化水平或實現智慧化。大數據時代下,數據是公開的,信息是可知的,所有的事物趨于透明化的狀態,極大改變了人類的思維方式,促進產業的轉型升級,對社會各個領域和行業的進步產生了深刻的影響。
1965年,英特爾聯合創始人戈登摩爾提出著名的“摩爾定律”:集成電路上可容納的元器件的數量每隔18個月就會增加一倍,性能也將提升一倍,價格會下降一半。這一定律準確的預期了我們科技進步的速度,揭示了信息技術進步的速度。在2013年前,整個IT界遵照定律控制硬件研發周期,如果沒有跟上技術革新的速度,必將因為性價比不足被市場淘汰,18個月成為IT產品的市場競爭窗口期。但是近幾年,因為光的波長限制,集成電路工藝已接近性能極限,摩爾定律逐漸不再適用當下的場景,而讓我們略感安慰的是,雖然硬件的制造發展進入了一個瓶頸,但是我們的軟件發展依舊日新月異,隨著人工智能技術的發展和大數據市場的爆發式增長,業界提出了所謂的“新摩爾定律”,即立足于技術產品的生命周定律,通過使用人工智能操作處理的數據幾乎每24個月翻一番,構建模型的性能也增加五倍,同時需要十倍的計算機性能作為支持。這一定律為更多的高科技公司提供了新時代的策略,指導了高科技公司的發展。如今,大數據的掌握分析將為我們社會生活迎來下一次變革的動力,這雖然不是徹底的革新,但足夠讓我們期待。
據統計,2017年全球的數據存量達到21.6ZB(1個ZB等于十萬億億字節),目前我們每天大約創造2.3萬億GB的數據,全球數據的增長速度在每年40%左右,預計到2020年或將超過40ZB以上,2025年或高達160ZB。據Wikibon與Statista預測,全球大數據市場軟件與服務收入預計將由2018年的420億美元增長至2027年的1030億美元。中國市場將承載最主要的增量,預計2018-2020年中國大數據市場增速將保持30%以上。
麥肯錫于2018年1月發布《Analytics Comes of Age》中指出分析與大數據在基礎材料與高科技行業當中作出巨大貢獻,它在經濟社會逐漸發揮著新興中流砥柱的作用,給人類帶來幾點核心價值:①技術價值:大數據根本上與數學、統計學、計算機學、數據學等基本理論知識無法分割,技術水平突飛猛進給數字領域帶來最直接的躍進,它不僅創造了新的計算方式、技術處理方式,更加為其他技術的研發、應用和落地提供基礎;②商業價值,在實際的升級運行中,企業也許會產生以下一些困惑:如何提升運營現狀?目標客群是誰?有哪些特點?與競品相比競爭優勢在哪?現有經營問題又是什么?這些問題都可以從海量數據中獲知,但是,想要完全的揭開這些問題的謎底,不可避免地要對這些海量數據進行分析和挖掘,利用分析數據得來的答案指導企業日常經營行為,提高運營能力,促進產品的輸出,甚至企業決策者也可以憑借大數據分析的結果來推動項目的實施,指導業務實踐,更好的管理公司,制定企業規則;③行業價值,客戶在一個開放市場中產生的各種行為數據,雖然大部分不能與特定的企業產生直接的關聯,但是它能夠很大程度上引導企業各種業務的開展方向,為整個行業的走向提供社會趨向指導,例如微信微博流量、區域偏好、移動數據、娛樂項目偏好等數據,它能夠勾勒客戶的個人心理畫像,展現行業發展在市場反饋中體現的影響和人們的態度趨向;④社會價值,大數據為人的生活帶來的不僅只是便利,還有緊密的生活服務網絡,我們利用大數據創造了時代價值,最終它也要進步,甚至會被新興的驅動力淘汰。
當下這20年稱為IT的“后摩爾時代”,它預示著要有IT市場的競爭力,就必須有強大的大數據處理能力適配,否則就會被時代淘汰。數據處理能力會催生新的社會需求,只有踩上了大數據這一高速賽道,才能不被AI時代所淘汰。在IT由T到I的大數據時代,一切事物的背后都是一種算法,數據處理即創造財富。我們來看看大數據整體解決方案是如何與農業、制造業、金融業、健康醫療、零售業等領域相結合,產生了哪些巨變。“大數據+農業”中將大數據運用到基因圖譜與測序,更好地指導農業生產;“大數據+制造業”將大數據運用到流程精準分析、自我調整,實現的IT化智能制造;“大數據+服務業”利用大數據提供針對性、差異化解決方案,如交通擁堵問題、醫療欺詐問題,促使公共服務快速向IT服務轉型。亞馬遜CEO貝索斯是在賣書的時候,借助平臺獲取海量數據和利用大數據分析,悄然成就了三大支柱性業務:云計算能力、物流能力和會員管理體系。基于對大數據時代對不同用戶行為的準確分析和理解,小米品牌緊跟用戶的需求,不斷修正自己的產品,推出新產品,立足于用戶的角度,深度把握與用戶的“共性”,持續優化用戶喜愛的“個性”,向用戶營銷自己的品牌和價值,形成自己獨特的高集中區的至上法寶。
眾所周知,國內中小企業因為沒有擔保,所以很難獲得貸款,這成為制約中小企業發展的重要因素。阿里巴巴就充分利用了大數據技術,對淘寶網上中小企業的經營狀態等海量數據進行分析,選擇一些財務健康、誠信良好的企業提供不需要擔保的貸款服務,幫助阿里巴巴穩定用戶池,拓展新產業。這些都說明了大數據賽道對各行業引領的強大牽引力,選對賽道,瞄準破局點。
人工智能就是通過認識、模擬和擴展人的自然智能,目的是為人類服務。現如今隨著科學技術的日新月異,人工智能技術也得到了進一步的升華,邁進了嶄新的發展階段,給科技的進步和人們的生活都帶來了翻天覆地的變化,改變我們的社會和生活,使人類進入到一個更加高度發達和繁榮的智能時代。截至2019年6月,我國人工智能企業數量超過1200家。我國進入了大力發展人工智能產業的階段,國家層面要求充分開發人工智能促進產業升級的潛能,圍繞人工智能產業構建生態圈,打造大數據時代的智能產業。根據《新一代人工智能發展規劃》,2020年我國人工智能產業成為新的重要經濟增長點,帶動相關產業規模超過1萬億元。目前人工智能發展到了新的階段,呈現出專業性、專用性和普惠性的特點。據IDC統計,2018年我國人工智能市場規模為161.9億元,預計到2022年市場規模將接近700億元,年復合增長率超過50%。
人工智能的發展總體分為兩個方向,分別是人工仿真和數據驅動。人工仿真主要是讓計算機模擬人的某種功能,對人的思維或行為進行模擬,近些年來,人工智能已經在感知智能上取得了長足的進步,甚至在許多領域達到或超出了人類的水準,解決了“聽、說、看”的問題。數據驅動主要是對周圍信息的感知,然后模擬人的智能思維過程去解決問題。如今人工仿真的技術研究暫時已處于瓶頸,更多專家提出了另一種解決問題的觀點:與其花時間去研究技術方法的改進,不如花時間大量積累數據,可以有效減少解決問題的時間。如語音識別技術,原來的識別頻率、適配詞匯、語義解釋的模式匹配識別技術遭到瓶頸,利用大規模語料資源的積累和訓練數據模型的完備,智能語音識別率提升到了97%,有效解決了噪音、方言和專業語境等問題。一個看似復雜的技術難題,在引入大數據之后輕松化解,隨著語音識別的精準和普及,相信很快自動化翻譯工具也會快速突破,大數據將引領未來的語音服務行業。目前,人工智能的工作范式是大數據+深度學習+計算能力,其中,大數據為人工智能提供豐富的數據與信息結構,深度學習提供自動學習方法與學習框架,計算能力為計算過程提速以支撐這種大數據的深度模型學習。
未來的五到十年將是人工智能技術的飛速發展時期,人工智能將大大改變經濟發展方式、社會服務、社會生活,加速智能社會的來臨。智能時代,數據不再是簡單的排列,有研究分析認為,基礎設備的建設為大數據的運用創造了良好的環境,到2020年,將有超過500億臺機器、設備進行互聯,超過2000億個聯網傳感器產生海量數據,服務于社會的方方面面。這將帶來更大的數字化“魔力”,因此,如何科學、高效利用數據,對產業與社會發展至關重要,工信部提出,將推進行業數據資源的采集、整合、共享和利用,創新合作模式,支持電信、互聯網、工業等領域率先開展跨行業的大數據應用,輔助人類的生存和生活,為人類帶來極大的變力。
憑借大數據驅動來解決實際問題具有三種能力:首先是數學模型的有效性。概率論中的“大數定律”,指出在試驗不變的條件下,重復試驗多次,隨機事件的頻率近似于它的概率,偶然中包含著某種必然。從另一個方面理解就是當數據量積累足夠大后,預測才有意義。例如,2008年,淘寶推出CPI(消費者價格指數)指標,與國家統計局應用采樣分析不同,淘寶的CPI所使用的數據是來自整個網站的全部交易數據,樣本量的基數相當龐大,相比國家統計局的CPI數據,淘寶CPI對商品價格變化反應更為敏感和全面;其次是計算能力的匹配性。利用互聯網和云計算技術,實現10萬臺量級的普通計算機進行海量計算,為大規模數據的實時處理提供了廉價、可靠、有效的技術支撐,這才使得大數據驅動得以展露手腳;最后是采集能力的普適效應。隨著移動互聯網和云存儲技術的發展,可穿戴設備、傳感設備通過網絡互聯,數據采集可以源源不斷地傳輸并保存,為大數據驅動奠定可持續數據來源基礎。
如今數字化轉型的浪潮正在不斷向前推進,大數據技術也有愈發的彰顯優勢,驅動大數據解決問題的能力,能夠有效提升公司生產、經營和管理的效率。我們來看一個名片識別技術變革的小案例。以前專家們一直致力于提高文字圖形識別技術、解析技術,但是識別錯誤率一直高居40%以上,后來獲取海量電子名片數據、公司數據后,由大數據系統對照匹配,現在只要能識別公司logo和姓名等個別文字后,就能將識別錯誤率降低到10%以內,文字識別瓶頸就這樣被輕松解決。
隨著數據驅動思維的運用,全新的商業邏輯變革悄然到來。目前傳統公司競爭不過互聯網公司的比比皆是,AT&T比不過亞馬遜、谷歌公司,電信移動運營商比不過阿里、騰訊公司,國有銀行比不過支付寶、微信支付,其根源就在于對大數據驅動智能商業的敏感性和適應性。這些企業對大數據給予了足夠的重視,充分使用大數據來為自己創造更大的收益,他們能夠快速地分析出大數據表達出來的深層含義,形成自己獨特的市場洞察,利用大數據分析結果合理分配自己的資源和能力,率先占據市場,打造自己的差異化競爭力,從而超越競爭對手。有數據不代表會用數據,用數據不代表可以用好數據,在未來的五年內將會有三類數據驅動型公司崛起:基于數據本身的公司、基于數據分析技能的公司、基于創新數據用途思維的公司。基于數據本身的公司一般擁有收集大量數據的平臺,但不一定能從數據中提取價值而盈利,如Twitter、VISA信用卡發行商會把自己擁有的數據授權給其他公司使用。基于數據分析技能的公司通常是咨詢公司或技術提供商,掌握專業的分析能力,能夠分析現有形勢,但不一定能從數據中創新應用。只有基于創新數據用途思維的公司最具生命力,因為他們懂得如何挖掘出數據潛在的價值,具有創新數據價值的思維方式,能夠利用創新想法來挖掘數據的潛在價值。
如伏特公司自己就具備專業技術獲取數據價值,同時也向專注于大數據挖掘的公司Pivota深度合作,沃爾瑪就是靠天睿公司合作分析來挖掘營銷創新點。再如谷歌、亞馬遜就是同時具備三項基礎的公司,谷歌的全景地圖服務就催生了自動智能駕駛汽車技術,亞馬遜的kindle筆記功能實現了購書偏好與銷售價值鏈反饋機制。相信很多用戶體驗過京東提供的211的物流配送服務:上午11:00前下單,當日送達;晚上11:00前下單,次日送達,其物流系統青龍就是利用大數據進行訂單預測,打造智慧物流,大幅提升配送效率,從而提升用戶獨特體驗。
傳統制造業的信息流通模式下,源頭廠家基本無法掌握其生產產品的最終使用用戶、使用感知甚至售后滿意度,需要通過調查問卷或由經銷商間接反饋,而這些都已經是加工過的信息,很難做到還原真相。現在有了大數據就能為生產商打通每件產品和用戶的體驗關聯,信息流通的成本透明化,真正做到與每個用戶“零距離”接觸,我們稱之為大數據時代的“感知毛細智能化”。
大數據的數據源要求是去結構化、無目的性的“雜亂數據”,只有多維度、無偏向、完備性的數據,才能使得各種認知偏見、數據誤差在海量數據匯集后得到糾正,因果關系不再重要,探索數據的關聯關系才是貼近事實真相的有效方向。這與統計學的精準性恰恰相反,由于人腦傾向于理解確定、無誤、高質量的數據,統計學為我們去繁就簡,指導如何獲取盡量少的精確樣本進行問題分析。同時統計學家們也發現:采樣分析的精準性是隨著采樣的隨機性的增加大幅提升的,即樣本的隨機性比樣本的數量更重要。多年來統計學研究各種分析模型來提高分析精準性,固有的缺陷逐漸顯現,隨著大數據技術的發展,海量數據的完備性可以更好的解決這個隨機性采樣問題,因為它不需要參考任何采樣子類,只要總體無誤差的數據量占比足夠大,完備性就可以得到保障。
面對海量的數據,如何準確獲取所需要的用戶行為數據,其實現途徑總體來說有四類,分別是建立收集平臺、轉型商業服務模式、專業數據公司或開發輕量級收集工具。建立數據收集平臺的特點是耗時長、具有頭部效應,像阿里巴巴的淘寶平臺、騰訊的微信平臺等。目前國內和國際上已有多家公司提供大數據平臺搭建服務,國外有名的公司有Cloudera,Hortonworks,MapR等,國內也有華為、明略數據、星環等。通過服務模式創新來收集數據具有成本低、見效快的特點,將一次性的消費變成售后多次消費,將買變成租的方式,都是為了能夠將低頻產品變成高頻服務后獲取海量用戶數據。專業數據公司像阿里巴巴、百度、騰訊等以幾十年的用戶行為數據沉淀為基礎,在政府、醫療、金融、零售、教育、電商等傳統領域開展對外大數據應用合作。開發輕量級收集工具可以快速獲取特定人群的相關數據,比如開發微信小程序、互動小游戲或APP等方式,可以精準鎖定某類用戶群體,通過線上娛樂、互動、分享等方式采集用戶行為數據。在企業體量較小,沒有足夠實力搭建大數據平臺的情況下,這種獲取用戶行為數據的方式是相當可取的。當然用戶數據的獲取不能逃避用戶的隱私問題,我認為這個隱私侵害的界定原則就是:不能通過數據標簽回溯到特定個人,但可以回溯到特定人群,滿足這條就算合理合規的隱私數據運用,可以放心使用、大膽使用、方便使用。
大數據服務創新如何盈利?數據能夠告訴我們,每一個客戶的行為特征,他們的消費偏好,簡單來說就是他們想要什么,喜歡什么,每個人的需求有哪些區別,哪些又可以被集合到一起來進行分類。大數據是數據數量上的增加,增加了數據分析結果的普適性,提高了企業的盈利能力。舉例來說,咖啡機不是易耗品,買賣一次可以用好幾年不壞,如何創新服務模式來獲取用戶使用數據呢?可以在咖啡機上加入RFID標簽和紅外感應或壓敏感應裝置,將咖啡機使用頻次、時間長短、時間間隔等信息通過家庭wifi上傳至大數據平臺,進而得到個性化消費習慣偏好數據,然后就可以嘗試不同口味的咖啡原料進行高頻精準投放,再進入大數據采集實現完備性數據獲取。這樣一來低頻的咖啡機可以超低價購買或者贈送給客戶,靠后期的咖啡原料、咖啡伴侶、甚至是咖啡調味服務來獲取真正盈利。
商業智能究竟給企業帶來怎樣的價值機會,在新興技術與渠道不斷更替的同時,數據的應運而生將企業與社會步入一個多元化的時代,大數據時代的到來促進了市場的活力,給不同需求的公司以及競爭伙伴帶來了更多的商業競爭機會,對促進產業結構的升級產生了毋庸置疑的影響,感知毛細的大數據,能夠將用戶個體Who 與行為細節 When、Where、Why和How一一對應,這將完全顛覆傳統商業思維模式。首先,從企業層面來看,商業智能變革是通過大數據在企業各個流通環節中的充分運用實現的,通過彰顯企業價值,實現企業創新,構建企業價值網絡;其次,從大數據產業鏈的角度來看,商業智能化變革是立體的,沿著大數據產業鏈的橫向延伸,縮短產業鏈的長度,減少不確定性,降低成本損耗,同時,沿著產業鏈的縱向擴展,根據縱向定位與整體行業外部環境結合起來,提供完整的解決方案,實現商業模式創新;最后,立足于行業層面,商業智能化變革是平臺商業模式與數據驅動跨界模式的連接與融合,以大數據作為基礎,搭建平臺化商業模式,實現跨境經營。
隨著大數據時代的逐漸深化,商業智能化變革的趨勢越發明顯,比如,大數據讓軟件變得更智能,更加符合人性化,典型的有手機輸入法可能通過分析我們日常交流中頻繁使用的詞語搭配,將這些詞語添加到手機詞典中,置頂出現,解決用戶打字交流的時間,為用戶帶來良好的交流體驗。大數據的出現改變了我們生活的方方面面,大大提高了我們的生活工作的效率。
來看制造業售后服務,傳統模式對產品的使用壽命是按照平均使用情況來估算,一般會留有余量,比如汽車發動機、輪胎、凈化水濾芯等,當這些產品裝上數據采集系統后,可以回傳使用過程中的海量數據,不僅能實時掌握產品的正常運轉情況,還可以及時發現隱患,防范于未然,將來的大數據售后服務必定是個性化的、定制化的。
再看服裝行業的智能應用,在模特身上的衣服怎么看都好,到了自己身上總覺得哪里不合適,這是因為服裝在設計時要不就是按模特身材,要不就是按大眾平均身材尺寸,現在我們在樣衣的拿放處、試衣間里放入感應裝置,廠家就可以實時獲取哪些款式的衣服被試穿了多少次,這些數據就可以指導設計師調整設計思路,快速感知當下市場時尚潮流走向。
大件消費品應用大數據后也會大不一樣,提供極其便利的個性化家庭服務,如智能電視的廣告可以做到按家庭的不同精準推送,對有學齡兒童的家庭、中產階級家庭、老中青俱全家庭、兩口小家庭、單身家庭等精準推送不一樣需求的廣告;智能冰箱可以做到水果、蔬菜、飲品優惠券的定向推送,實現“你剛好用完,優惠券剛好送達”;谷歌公司去年就收購了幾個家庭智能wifi項目公司,為的就是搶占家庭智能wifi入口,獲取海量wifi使用行為之后,可以準確定位、細分市場,捕捉到平時無法獲取的細節,就能轉化無限商機和盈利機會。
大數據技術是一種工具,大數據思維是技術的進步產生的新思維觀。從大數據思維方式來思考問題,解決問題是當下企業的潮流。大數據思維開啟了一次重大的時代轉型。馬云說過:沒有人可以阻礙大數據時代。這將是一個劃時代的變遷,物質資本、勞動力資本將不再重要,大數據和金融資本將越來越重要,未來商業競爭都將建立在取之不盡,用之不竭的數據創新上,大數據思維促使智能商業快速變革,整個數字經濟體系將重構傳統經濟模式。