文|徐明

大國與大國之間要有壓艙石,關系才能穩健與發展,城市大數據的價值發現也要有自身的壓艙石,否則,飄忽得下不來,遲早會破裂。這篇隨心短文就是分享我這方面的淺薄之見,以為《晃晃悠悠談城市大數據》續篇。
談城市大數據的價值發現,離不開城市數據,而城市數據的采集和傳輸一直不易。今天,我們有理由相信,物聯網將極大助力城市數據的采集和傳輸,讓大數據技術多了一個充分展示才華的舞臺。自從Kevin于1995年提出物聯網這一術語,至今已經20多年,從去年開始我一直深信,物聯網已經來到風口。杰里米.里夫金在《零邊際成本社會》一書中專門論述了即將到來的一個物聯網、合作共贏的新經濟時代。中興通訊新任董事長兼總裁趙先明博士在剛剛過去的上海世界移動大會上也專門發表了《IOT 聯接萬物 聯生價值》的演講。發展物聯網,提升城市生活,已然成為智慧城市建設繞不開的話題。
數據時代,數據將成為最核心的生產要素,城市數據對于城市而言也是如此。然而,面對巨大投資后獲取的龐大數據,找到創造價值實現數據應用和變現的確是一個難題。我們必須面對一個真實的現實,城市大數據的信息熵值很低。互聯網和智能終端的普遍服務,使城市數據的獲取成本越來越低,這反而導致了城市數據的信息熵值降低了。所以,城市數據的應用和價值變現是現階段最有難度的領域,我也贊成部分專家的觀點:我們依舊在大數據時代的門口徘徊。這個領域的很多人也被逼得自學成才,多多少少都有了幾分忽悠本領,行走江湖,真心不易。
但我依然看好城市大數據的前景。今天,城市的太多問題、挑戰和居民需求迫切需要城市大數據來解決,我們沒有多少余地。
城市大數據的價值挖掘壓艙石是什么呢?我的觀點是:一是算法;二是行業力。算法是指一組包含了有限、明確并有先后順序的指令集合。算法與模型及學習形影不離,某種程度上也是不可分割。學生時代,我也曾經用神經網絡來學習最具不確定性的混沌吸引子,驚喜于算法模型在數據面前的強大學習能力。綿綿不斷的數據,將助力算法和模型持續迭代優化,通過學習變得越來越聰明。沒有基本的算法模型,城市大數據的挖掘沒有基礎,算法是城市大數據價值挖掘的首要壓艙石。阿里巴巴的總參謀長曾鳴對算法極為推崇,認為算法是數據的引擎和智能的核心,唯有算法才能讓數據的能量完全噴發。騰訊吳軍博士所著《數學之美》的書中處處可見算法之美。我私下時刻盼望深度學習“元”階段的到來,因為這個階段據說算法將會自動生成。行業力是我編撰的一個詞,我將之定義為對行業及業務的理解深度和建模能力。單純的數據本身只能說明數據說了些什么,但無法解釋其真正含義,數據分析師只有與行業專家結合,才能完整解讀數據背后的故事。提升行業力的唯一辦法就是有一支數據分析師和行業專家組成的聯合團隊。在我看來,即便城市大數據產業自身單獨發展也會比較艱難,與行業(業務)結盟發展將是挖掘城市大數據價值的主要路徑。對行業與業務一無所知的數據分析與挖掘,建起的永遠是海市蜃樓,飄在空中的樓閣而已,勞命傷財,毫無益處。
如果你有些許贊成算法和行業力是城市大數據價值挖掘的兩個基石,請著手成立數據科學家和數據分析師以及行業專家的團隊,他們將是變現你所擁有的城市大數據的基礎,唯有他們,才有可能將大數據的美好愿望變成可以感知的現實。這也許將會導致本來已經非常熱俏的算法專家更加千金難覓。
城市數據的流動,算法模型的學習成長,行業產品與服務的迭代改進,這一定會構建起新的城市商業生態,讓城市的明天更美更好!