李 博,高 文,張 明,盛 剛
(天津市科技統計與發展研究中心 天津300051)
近兩年來,天津市成功舉辦了世界智能大會,以此為契機,為了讓“智能”這座燈塔引領海河號航船乘風破浪、萬里航行,離不開大數據產業的蓬勃發展。當前,京津冀協同發展是一項重大國家發展戰略。京津冀地區在發展大數據產業方面各自都具備自身的優勢,但也存在一些局限,在三地協同創新發展的大框架下,實現三地大數據產業優勢互補是加快我市大數據產業發展的關鍵所在。考慮到各項統計數據的可用性和可比性,本文以 2015年與大數據產業發展有關的數據為基礎,從大數據產業的發展基礎、軟件行業發展狀況、科技研發基礎、土地資源情況、人力資源成本等多個維度對實現三地大數據產業錯位發展進行分析,并給出對策建議。
大數據是指在開展相關領域的業務活動過程中產生的結構化、非結構化數據以及在二者之間的半結構化數據的集合[1]。大數據的定義是利用新的數據處理模式,具有更強決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產[2]。大數據所具有的特性可進一步歸納為 4V,即海量(Volume)、多樣(Variety)、高價值(Value)和快速(Velocity),其中,海量是指巨大的數據量,當前大數據的體量已由萬億字節(TB)級別提升到千萬億字節(PB);多樣是指數據結構和類型繁多,大數據所包含數據類型有文本、視頻、音頻、圖片、日志、空間位置等多種類型,以及向量、矩陣、樹型、圖等多種存儲結構;高價值是指數據具有潛在的應用價值,即潛藏著大量的有用信息,可以進行深度挖掘和分析;快速是指處理數據需要較快的速度。通常,大數據需要云計算技術作為支撐,其處理速度可達秒級。
從本質上講,大數據是數據積累量達到一定數量時所形成的數據的集合以及在該集合基礎上的一系列算法。大數據技術的有效利用,可以在大規模數據分析、輔助預測和決策的基礎上,從簡單的信息交換到先進的計算,改善互聯網的應用。
信息技術產業是大數據產業的基礎,發展大數據產業離不開信息技術產業的支撐與帶動。在信息技術產業發展方面,北京在京津冀三地中具有突出的優勢[3]。2015年,北京市信息傳輸、軟件和信息服務業實現地區生產總值 2383.9億元,這與北京市政府的重視和財政資源的大量投入密切相關。2015年北京市信息傳輸、軟件和信息服務業固定資產投資242.7億元,這為北京市打造完善的基礎設施和高速發展的信息業奠定了扎實的基礎,也吸引了更多的中高級專業技術人員從事這一行業。2015年北京市信息傳輸、軟件和信息技術服務業從業人員達到92.2萬人。上述指標北京市均較大幅度地高于天津市和河北省。因此,與天津和河北相比,北京有更完整的信息產業發展基礎和更高級的專業技術人才。
計算機軟件技術是發展大數據產業的核心,大數據產業發展的各環節都離不開計算機軟件技術的支撐。就京津冀三地軟件行業發展狀況比較,也存在較大的差距。截止到 2015年底,北京市共有從業企業2655家,實現業務收入5422.87億元;天津市共有從業企業518家,實現業務收入1007.85億元;河北省共有從業企業284家,實現業務收入184.47億元。從軟件業從業企業數量和實現業務收入兩個維度的比較可知,北京市的軟件產業比天津市和河北省的產業規模更大、實現效率更高。
雖然北京市在軟件產業發展水平方面遙遙領先,但從軟件產業細分的各科目分析,京津冀三地軟件產業發展的側重各不相同,如表1所示。

表1 京津冀三地軟件產業分類比較(單位:億元)Tab.1 Comparison of softwares industry classification between Beijing, Tianjin and Hebei
北京市的軟件相關產品的收入和信息技術服務收入兩個指標均顯著高于其他兩省市。天津市的嵌入式系統軟件產品收入幾乎是北京同類項目收入的十倍,在京津冀三地中最高。河北省軟件產業發展相對較弱,上述三項指標均明顯低于京津兩市,但河北省信息技術服務收入占軟件業務收入的比重達80.66%,在三省市中占比最高。
大數據產業屬于高新技術產業,因此研發水平的高低對產業發展有著決定性的作用[4]。從研究與試驗發展(R&D)的角度看,2015年,北京市全年R&D經費支出1384.0億元,相當于地區生產總值的6.01%;天津市全年 R&D經費支出 510.2億元,相當于地區生產總值的 3.08%;河北省全年 R&D經費支出352.1億元,相當于地區生產總值的 1.18%。從專業技術人員數量方面看,在 2015年,北京市各類企事業單位中,從事研究與試驗發展(R&D)活動的人員數量達到近 35萬人,全市 138家研究生培養機構共招收各類(博士、碩士)研究生合計約 9.5萬人,畢業研究生7.9萬余人,在讀研究生28.3萬余人;天津市共有研究與試驗發展(R&D)活動人員 17.7萬余人,天津市共有高等院校 55所,全年招收研究生 1.8萬余人,畢業研究生 1.6萬余人,在讀研究生 5.3萬余人;河北省共有研究與試驗發展(R&D)活動人員0.9萬余人,河北省共有研究生培養機構 25家,全年招收研究生 1.4萬余人,畢業研究生 1.2萬余人,在讀研究生 4.0萬余人。綜合以上數據分析可知,北京市全社會 R&D經費投入強度(R&D/GDP)和 G&D經費支出數量(含內部 R&D經費支出和外部 R&D經費支出)均大幅度高于天津和河北,并且當前專業人員數量和后備科技人員數量雙雙高于其他兩省市。因此,與天津、河北兩地相比,北京市的科技研發基礎和潛力最強[5]。
與其他新興產業不同,大數據產業對土地資源也有一定的需求,其后續擴充及與其相關的其他產業發展也需要廣闊的發展地域。京津冀三地同處環渤海地區,地域分布上緊密相鄰,但三地的土地面積和人口密度卻相差很大。其中,北京市土地面積約1.64萬 km2,擁有常住人口約 2170萬人,人口密度達 0.132萬人/km2;天津市土地面積約 1.19萬 km2,有常住人口近1547萬人,人口密度達0.129萬人/km2;河北省土地面積約 18.88萬 km2,擁有常住人口近7425萬人,人口密度為0.039萬人/km2。從以上數據可以看出,與京津兩地相比,河北省土地面積大,人口密度小,具有更大的區間發展優勢和空間發展潛力。
大數據產業發展,離不開強有力的人力資源做后盾。而擁有更低的勞動力成本,將會為企業發展節約更多的資源,提高企業的市場競爭力,推動企業良性運作,帶動產業整體發展。據統計,2015年度北京市、天津市和河北省城鎮居民人均可支配收入分別為48458元、34101元和18118元。從以上數據分析的結果可以發現,在人力資源成本方面,河北省有著明顯的優勢[6]。
大數據產業涉及計算機軟件、網絡信息安全、移動互聯網、數據挖掘等多個領域,涵蓋的內容繁雜而細微,所需數據存儲量大,存儲空間多樣。僅數據搜集一項內容就會涉及很多單位及部門。因此,完全由一個省份建立完善的大數據創新產業鏈條,需要前期投入的人力物力財力資源將會十分巨大,同時京津冀三地大數據產業發展的建設基礎條件各有優劣,既能互補又各具特色。鑒于 3個地區在基礎設施、研發能力、土地資源、人力資源等方面受到限制,可以充分利用這3個地區的現有發展優勢,設計一個適合3個地方合作發展,實現三贏合作的大數據產業創新發展規劃。在北京—天津—河北協調發展戰略指導下,實現三地大數據產業鏈產業創新驅動發展產業鏈聯合建設,推動京津冀三地在大數據產業布局分配及其相關的側重點上實現差異化發展,取長補短,協同創新。
搜集有效數據,清洗臟數據是大數據產業發展的開端,更是利用現有數據挖掘有用信息,實現利用數據開展業務工作的分析和研究的前提條件,全面、充分的數據分析可以使數據表征業務工作更加客觀和準確,可使獲得的結論更有參考價值。目前,北京、天津、河北三地政府、行業和互聯網站點積累了大量的數據資源,但受到“一畝三分地”概念的限制,抑或對現有數據資源獲取、整合、利用等能力的制約,很多數據并未完全實現有效共享和充分利用,致使大量數據資源被白白浪費。因此,建議北京、天津、河北3個地區建立統一的大數據服務系統平臺和共享數據庫,最大限度地對數據資源進行挖掘,使其能夠創造出更多、更大、更有效的社會、經濟價值。
3.3.1 在北京構建大數據研發及技術應用中心
通過以上分析和比較可見,北京市的軟件產業發展態勢強勁、狀態最好,軟件相關產業的企業數量最多,軟件企業的業務收入在三地中也最高,同時北京市具備最為雄厚的技術開發基礎,因此建議在北京市建立以大數據研發進而技術應用為基礎的研發中心,完成對大數據產業新技術的研發和創新。此外,針對北京市信息產業整體發展狀況領先于天津和河北兩地的現實,以及北京市擁有諸多大型企業總部的特點,建議將大數據應用中心設立在北京市,以便能將挖掘和分析的數據更好地投入應用。
3.3.2 在天津構建大數據產業設備生產基地和云計算中心
天津市嵌入式系統軟件收入和集成電路設計的收入均高于其他兩省市。此外,嵌入式系統綜合了計算機軟硬件、傳感器、集成電路與微電子等各項相關技術融合一體的復雜多樣化系統,在整體物聯網體系中擔負著信息分析、處理和管理的核心作用;物聯網產業更是天津市大力發展的重點產業之一,天津在云端服務器、存儲器、路由器等相關技術處在全國領先地位。因此,在天津構建以物聯網和云計算相關設備為基礎的產業化基地,有效支持大數據產業發展。同時,依托天津濱海新區云計算產業化基地和國家超級計算天津中心,借助“天河一號”高性能計算平臺,在天津搭建云計算中心,實現大數據計算的本地化。
3.3.3 在河北構建數據搜集及存儲服務中心
相對于北京和天津,河北省具有土地資源豐富及人力資源成本低的比較優勢,這為建設大數據存儲中心提供了有力的土地資源保證和人力資源支持。然而,受到投資、招商、人才吸引方面的制約,并充分考慮到計算機軟硬件維護的便利性,大數據存儲中心不適合建設在遠離大型中心城市的地方。因此,應充分發揮河北省毗鄰京津的地域優勢,構建云存儲與服務基地,側重大數據的搜集及存儲服務。
此外,由于河北省下設多個城市,特別是新設立了雄安新區,造成省內各城市之間可能會因為總體規劃不明確而出現多個城市大數據產業規劃雷同,產品服務同質化,特別是京津冀大數據產業協同發展與雄安新區規劃之間的相互關系等,需要河北省立足雄安新區建設,統籌規劃全省大數據產業存儲基地建設步伐,協同省內各市開展相互協作,彼此互利,實現在本省內建成大數據存儲網絡體系。
基于京津冀協同發展的國家戰略,充分發揮北京、天津和河北省的各自優勢,在北京建立研發基地,在天津構建設備研發基地和計算中心,在河北省建立數據存儲庫基地,利于實現三地大數據資源的有效利用和合理整合,提升北京、天津、河北三大數據產業的整體發展水平。