文 羅婷 紀婷婷 楊琳 宋俊典
大數據,迄今為止尚未有標準的學術定義。但毋庸置疑的是,數據對人們生活帶來了極大改變。每個人看到的朋友圈廣告并不相同——這是因為大數據在背后挑選適合你的廣告;每位用戶在新聞客戶端看到的新聞也不相同——這是因為大數據知道你的喜好……身處大數據時代,發展大數據已經成為每個國家、每個城市的共識。
近日,本刊記者采訪了上海軟件中心副主任張紹華博士。他就上海大數據產業發展、大數據的應用和實踐、大數據標準的制定等問題表達了自己的獨到看法。
近年來,上海在大數據領域的研究和發展勢頭強勁。2013年,上海發布《上海推進大數據研究與發展三年行動計劃(2013-2015年)》和《2013-2015年的云計算發展規劃》(以下簡稱“大數據三年行動規劃”),是全國首個發布地方大數據行動規劃的城市;復旦大學等高校在全國率先開展“數據科學”專業研究生和大數據工程碩士培養工作,上海在大數據學科研究方面快人一步;在大數據應用方面,上海在健康醫療、城市交通、互聯網廣告、航空航運等諸多領域開展了大數據應用。
“上海大數據產業在政府推動、高校科研、細分領域如精準營銷等走在全國前列。”張紹華在分析上海發展大數據產業機遇和挑戰時說到,“但上海在大數據產業中缺少龍頭企業”。
上海軟件中心是“大數據三年行動規劃”的主要參與者。張紹華介紹,“大數據三年行動規劃”明確了上海發展大數據產業的戰略意義和初步工作內容。接下來,進一步探尋大數據技術和產業發展方向,解決“做什么”、“怎么做”兩個問題顯得尤為重要。
目前,上海產業技術研究院和上海軟件中心承擔了大數據及云計算的技術路線圖專題研究這一課題。大數據及云計算技術路線圖,將會根據上海的資源稟賦,研究推進上海大數據產業發展的政策、措施等。
具體來說,大數據及云計算技術路線圖要從大數據戰略發展研究、大數據技術提升工程發展路線、大數據資源儲備和數據交易發展途徑、大數據產業環境營造方式、大數據應用工程的實施路徑、規劃大數據人才工程發展措施共六個大數據相關領域進行研究。研究成果將具有前瞻和預判作用,一旦實施,將會對區域經濟社會全局和長遠發展具有重要促進作用和深遠影響力。
不過,描繪這一路線圖并不容易。有觀點認為“路線圖規劃不出阿里巴巴和馬云”,言下之意是指推動產業發展需要遵循市場規律,政府并不能規劃出產業發展路徑。另一種觀點則認為“雖然Google、Facebook等具體公司的出現是很難預測的,但這種互聯網產業的發展離不開產業戰略規劃的營造、培育和推動”,這種觀點的一個有力論據是——美、英、澳、法、日、韓等發達國家都相繼制定和實施了大數據戰略性文件,積極推動大數據發展。
因此,對于該課題來說,需要找到合適的方法把握規劃的“度”,“路線圖不能太宏觀,也不能太細致,否則就失去了路線圖的意義。”張紹華表示,上海軟件中心匯聚了一大批專家學者,已經找到方法進行大數據及云計算技術路線圖研究。
根據Cisco預測,2010年至2015年,全球移動數據流量將激增26倍,將達到6.3EB/月,寬帶IP數據流量將達到80.5EB/月。流量的急劇膨脹為大數據業務的未來提供了一片沃土。根據《2015年中國大數據交易白皮書》透露的數據,2014年中國大數據市場規模達到767億元,同比增長27.83%。預計到2020年,中國大數據產業市場規模將達到8228.81億元。
面對龐大的數據規模以及大數據產業的市場規模,推進大數據的應用成為促進大數據發展重中之重。
事實上在今年8月19日,國務院常務會議通過《關于促進大數據發展的行動綱要》,這意味著我國大數據發展迎來頂層設計。《綱要》提出,要“大力推動政府信息系統和公共數據互聯開放共享,加快政府信息平臺整合,消除信息孤島,推進數據資源向社會開放,增強政府公信力,引導社會發展,服務公眾企業”。
上海政府在數據開放方面走在前列。據媒體報道,目前上海已開放11個領域逾500項數據。“上海市政府數據服務網”于2012年6月在國內率先上線,截至2015年7月底,該網已累計開放數據集逾500項,涵蓋了經濟建設、資源環境、教育科技、道路交通等11個重點領域,到2015年底上海開放數據集總量有望達到1000項。
例如上海市交通委提供了包括全市搬場企業名錄、全市公交樞紐站分布、中心城區公交站點分布、停車場位置等數據;上海市住房保障管理局開放了保障房工程信息、房地產開發企業信息、房地產經紀企業信息等數據。隨著越來越多的數據開放,大數據能夠改變的領域將越來越多。
張紹華告訴《華東科技》,政府數據開放是大勢所趨,但在數據開放的同時一定要有相關政策法規進行配套,以保障數據安全合理運用;另一方面,企業不能過于依賴于政府來開放數據,要發揮企業自身技術進行數據采集和交換,積累核心競爭力。
大數據研究和應用需要有大量的真實數據以進行實驗、創新和應用。據了解,上海軟件中心協同中國電信旗下上海理想信息產業(集團)有限公司等單位參與上海互聯網大數據工程中心的建設。張紹華介紹說,希望通過該工程中心,針對互聯網領域把數據和技術轉化成應用和產業。“我們希望有一個數據存儲、分析、應用的實驗場,工程中心的研發團隊,將匯聚的各領域數據進行脫敏處理后,研發一些新技術和新產品。”
張紹華舉例說,可以將交通數據、運營商數據等數據整合起來,為政府、企業提供決策咨詢服務。“例如可以通過數據的整合和分析,預判某一區域未來5到10分鐘里的人群流動情況。”張紹華進一步解釋說,上海軟件中心會優先開發那些應用廣泛的、偏公益性質的技術和產品。
這些開發的新產品、新技術也會放在上海產業技術研究院和上海軟件中心發起的大數據共享服務平臺中。這一平臺早在三年前就已經開始建設,目前已經在持續運營階段,在理念上與今年4月14日成立的貴陽大數據交易所不謀而合:手握大數據的企業可以將大數據進行交易,一方面獲取自己所需的大數據,另一方面可以將手中的大數據變現。
不過,對于大數據交易可能涉及隱私以及商業秘密泄露等問題大可不必擔心。大數據交易的不是底層的基礎數據,而是通過清洗建模出來的數據結果,且所有交易環節都在法律法規和政府監管下進行。張紹華說,大數據共享服務平臺未來會在上海大數據交易中心建設中發揮重要的支撐作用。
張紹華表示,大數據的應用和產業化需要大量載體來支撐。無論是大數據工程中心,還是上海大數據交易中心,或是不久前成立的復旦大學大數據學院、復旦大學大數據研究院等組織機構,都是支撐大數據產業化的重要載體。
在《關于促進大數據發展的行動綱要》中,大數據被明確為國家基礎性戰略資源,要求堅持創新驅動發展,加快大數據部署,深化大數據應用。張紹華認為,當前國內要實現數據相連、深化大數據應用,大數據產業發展的標準、安全等也應當得到重視。
目前,工信部已經指導全國信息技術標準化委員會組建了中國電子工業標準化技術協會信息技術服務分會(ITSS)、大數據標準工作組等開展大數據標準研制工作。各分會和工作組陸續組織起草了《數據治理白皮書》,完成了《大數據治理與服務》一書的出版發行,制定大數據標準體系,已經開展數據質量、數據安全、數據開放共享和交易等方面的10多項國家標準的立項和研制工作。
事實上,從戰略層面的標準制定到某一個技術細節標準制定,大數據產業鏈上每一個環節都需要有相應標準。在一系列標準中,上海軟件中心在數據治理標準的制定上投入了很多精力。在張紹華看來,數據治理標準是大數據產業最為重要的標準之一,是大數據產業要大規模發展的必要支撐。

據介紹,上海軟件中心是國內數據治理研究工作的引領單位。從2013年起,上海軟件中心就開展數據治理相關的理論和實踐研究。2014年11月,在ISO國際標準化組織IT治理工作組會議上,上海軟件中心代表中國提交了英文版《數據治理白皮書》,獲得全球與會專家的認可。2014年12月到2015年3月期間,在上海市科學技術委員會、上海市經濟與信息化委員會、上海產業技術研究院、上海大數據產業技術創新戰略聯盟的大力支持下,上海軟件中心對百度、騰訊、銀聯、中國華融集團、神華集團、中國移動集團等公司開展了調研,形成了國內第一份數據治理研究報告。
資料顯示,數據治理英文是Data Governance,數據治理本質上就是對企業的數據管理和利用進行評估、指導和監督,通過提供不斷創新的數據服務,為企業創造價值。張紹華表示,數據治理標準強調數據資產、數據責任、數據文化的概念,這些理念將在國內數據系列標準得到貫徹。
張紹華進一步解釋說,制定數據治理標準的意義主要體現在三個方面:一是能夠從戰略層面解答企業為什么要使用大數據;二是為大數據應用實施提供組織保障;第三是提供技術體系。“最為重要是,要通過數據治理標準的制定形成治理的文化和思維。”
事實上,上海軟件中心不僅在國內主導國內數據治理標準研究,也是國際數據治理標準的主要參與者。目前,國際國內數據治理的標準將同步推進。
推動大數據產業發展不能單打獨斗,而是要協同發展。習近平總書記指出,“經濟全球化和區域一體化乃大勢所趨”。近年來,大數據受到各界廣泛關注,已滲透到金融、醫療、消費、電力、制造以及幾乎各個行業,大數據的新產品、新技術、新服務也正在不斷地涌現。
事實上,大數據產業集聚發展效應開始顯現,出現京津冀區域、長三角地區、珠三角地區和中西部4個集聚發展區,各具發展特色。北京依托中關村在信息產業的領先優勢,快速集聚和培養了一批大數據企業,繼而迅速將集聚勢能擴散到津冀地區,形成京津冀大數據走廊格局。長三角地區城市將大數據與當地智慧城市、云計算發展緊密結合,使大數據既有支撐又有的放矢,吸引了大批大數據企業。珠三角地區在產業管理和應用發展等方面率先垂范,對企業扶持力度大,集聚效應明顯。大數據產業鏈上下游企業合作意愿強烈,各集聚區間的合作步伐加快,產學研協同創新發展初見成效。
上海產業技術研究院和上海軟件中心聯合多家產學研機構對長三角大數據產業發展進行了戰略研究。張紹華說,長三角發展大數據產業具有得天獨厚的優勢:建設成為有全球影響力的科技創新中心是中央對上海的新要求、新定位,也是上海突破自身發展瓶頸、重構發展動力的根本舉措;長三角地區的戰略定位——亞太地區的國際門戶、全球現代服務業和先進制造業中心、世界級城市群,使得長三角地區是全國綜合經濟實力最強的地區之一,已經形成了以上海建設“四個中心”、發展“四新”經濟為核心,輻射帶動長三角城市群協同發展的新格局;上海位居國內城市信息化綜合排名第一,阿里巴巴在電子商務領域遠超國內甚至是國際上的其他企業,各省市也不乏全國領先的IT龍頭企業,有較好的發展大數據的基礎;長三角地區在醫療健康、智能交通、金融、物聯網、先進制造業等行業有著豐富的數據資源;長三角還聚集復旦大學、上海交通大學、浙江大學、南京大學等一大批國內知名高校,為長三角大數據人才培養提供了保障。
張紹華認為,物流、交通、環保、天氣應用、食品安全等領域的大數據戰略布局可以也必須以長三角一體化思路來考慮。要實現長三角地區大數據產業整體騰飛的目標,國家要加快數據跨境流動監管法律機制研究,設立國家級數據交易所使數據交易規范有序等。在長三角區域整體層面,成立長三角大數據協同發展辦公室,整體規劃,協調發展長三角大數據產業等。各省市在長三角區域整體規劃基礎上,細化引領性行業的重點發展方向、前瞻性研發的主攻方向、出臺配套政策,協力打造長三角智能城市群等。
可以預見,未來幾年長三角地區的大數據產業將會迎來一輪高速發展,產業輪廓逐漸明晰,產業鏈逐步形成。長三角各城市將充分發揮自己的地理優勢和行業優勢,取長補短,協同發展。