何菲
《超驗駭客》這部科幻電影正在上映,如果你對電腦深度學習系統和人工智能感興趣,不妨去看看,一個高智商技術宅男如何差一點就接管了世界。這部電影試圖回答一個疑問:當具有高度學習能力的電腦全面接管人們的基本生活,對后者可能帶來哪些改變?《超驗駭客》所描繪的場景依然很遙遠,百度大數據卻近在眼前。“百度大腦智商相當于兩三歲小孩,可能很快超越成年人。”李彥宏在百度第四屆技術開放日上扔下一枚重磅炸彈。
這位 “小孩”的智力還在不斷增長。“根據摩爾定律,每隔18個月計算機計算能力會增加一倍,成本會下降到原來一半。”李彥宏說,“這是一種量變,摩爾定律繼續做十年二十年,質變就會發生,這樣的一個大腦很有可能比人腦還要聰明。”百度試圖通過包括“百度大腦”在內的大數據技術開放平臺敲開各個重點行業甚至政府機構的大門。為此,百度已做了不少鋪墊。
今年春節期間,中央電視臺《晚間新聞》與百度合作,首次啟用百度地圖定位可視化大數據播報了國內春節人口遷徙情況。這個報道建立在百度推出的人口遷徙大數據項目上。“百度地圖春節人口遷徙大數據”(簡稱“百度遷徙”)。利用百度后臺每天數十億次LBS(基于地理位置的服務)定位數據進行計算分析,展現了春節前后人口大遷徙的軌跡與特征。
海量的語音數據可以幫助年輕的父母們聽懂孩子的哭聲。百度大數據技術可以把中文語音轉換成中文的文字。在把海量的嬰兒聲紋上傳到大數據中心提取特征之后,年輕父母在錄下嬰兒哭聲上網比對,就可以知道孩子因為什么哭:是餓了,還是只想撒撒嬌。
在吊足了業界胃口之后,百度依然面臨一個問題:在各家都在兜售自己的云和大數據的時候,百度應該怎樣使自己脫穎而出?接管行業甚至政府數據,是百度大數據戰略的下一步。針對這一方向,百度的策略是:軟硬兼施。
最近,百度宣布正式發布大數據引擎,將包括開放云、數據工廠、百度大腦三大組件在內的核心大數據能力開放,通過大數據引擎向外界提供大數據存儲、分析及挖掘的技術能力,這也是全球首個開放大數據引擎。
“百度開放云”是大數據引擎運行的基礎構件,通過分布各地的百度新一代高效能數據中心為傳統行業提供超大規模的數據存儲和分布式計算。在此基礎上,“數據工廠”對行業數據進行一系列規范化處理,提供強大的數據管理和分析能力。更上一層,則是百度人工智能的精華——“百度大腦(Baidu Brain)”,基于百度深度學習研究院的領先成果,
按照百度的說法,百度大腦融合了全球領先的深度學習算法、數據建模、大規模GPU并行化平臺等技術,實現了無時無刻都在學習與成長,它擁有200億個參數,構造起世界上最大的深度神經網絡。
因為數據無法互聯互通,不少機構、傳統企業甚至政府部門正在成為一個個數據孤島,其數據存儲與管理的規模、數據分析挖掘以及智能化能力也處在從數據累積的量變過程轉化為“數據智能”質變過程的臨界點上。
百度也需要前者的數據。這家公司需要把各個行業存在本地的所謂小數據通過百度云和數據工廠處理變成大數據,以豐富自己的數據庫資源,通過機器學習,使自身的數據庫更為智能和精準。
從可行性上看,制造業、交通管理部門甚至餐館服務業,都因攝像頭設備而產生各種各樣的視頻。但這些行業和部門沒有更多的技術對這些視頻進行解構和識別,以便于檢索和分析。比如在交通行業,各個監控路口的攝像頭24小時監控著各個路段的交通流量。通過百度地圖大數據和搜索大數據的建模分析,百度大數據引擎可以提供出行趨勢預測。此外,移動互聯網時代,手機(尤其是定位器和照相機功能)、移動傳感器、可穿戴設備等各種移動設備也產生了豐富而多樣的數據。
但是百度需要強化自己對硬件的控制力。今年3月,“百度智能硬件品牌日”正式上線京東商城。此次上線的百度旗下智能硬件產品,涉及家庭娛樂、運動健康、視頻安防、車載導航等多個領域。
上述傳統行業是百度必須拿下的市場,不少行業的單行業產值都在萬億級以上。目前的消息是,百度大數據引擎將逐步開放,當下先采取邀請制和免費模式,在政府、NGO、制造、醫療、金融、零售、娛樂、教育等傳統領域率先開展項目合作。
哪些行業會接受百度拋來的橄欖枝呢?
一個可以確定的消息是,北京交通運輸管理部門的部分應用正計劃遷移至百度開放云平臺,利用大數據引擎對行業監測數據進行挖掘分析。