翟麗麗,劉曉珊,楊彩霞
(哈爾濱理工大學 經濟與管理學院,黑龍江 哈爾濱150040)
隨著云計算、移動互聯網、物聯網、人工智能等新一代信息技術的不斷升級和普及應用,人類社會快速進入大數據時代。中共十八屆五中全會首次提出國家大數據戰略,推動我國從數據大國向數據強國轉變。“十四五”規劃強調加快推動數字產業化,推進產業數字化轉型,營造良好的數字生態。大數據的潛力不可估量,率先建立起完整大數據產業生態系統的國家將在產業發展中占據先機。因此,構建完備的大數據產業生態系統對建設數據強國、提高國家競爭力具有重要意義。對于大數據產業生態系統演化路徑的研究有助于及時、準確判斷系統所處狀態階段,明確大數據產業生態系統發展方向,為企業轉型升級提供方向指引和政策建議,保證大數據產業生態系統的可持續健康發展。
在大數據產業生態系統演化過程中,受主體間關系變化的影響,系統中不同特征的主體種群共生發展[1],種群生長規律符合生物學中的Logistic生長函數模型[2]。目前學者們多利用Logistic模型對企業功能特征種群間[3]、數據主題種群間[4]等不同分類的種群進行主體間關系研究,給出不同特性種群的演化路徑。同時,數據資源作為重要生產要素,是系統發展的核心資源,因而還要考慮資源流動對系統演化的影響。Logistic模型無法體現資源的影響作用,而熵模型可用于分析資源變化對系統發展演變的影響[5-7]從而優化系統資源配置[8]。
在大數據產業生態系統中,不同數據資源特征的種群內與種群間都伴隨著資源交流,種群主體間關系和資源交流變化共同決定系統演化路徑。因此,將Logistic模型與熵模型相結合能全面揭示大數據產業生態系統中不同特性的核心種群相互促進和資源流動的演化規律,進而研究大數據產業生態系統演化路徑。研究結論可為國家、行業、企業等不同層面實施大數據發展戰略提供重要理論支持。
目前對大數據產業生態系統的研究主要集中在系統構建與發展方面。關于大數據產業生態系統的構建,Gorodetsky等[9]、Cui等[10]認為,大數據與工業生產制造、物流相結合能形成基于自組織特性的大數據產業生態系統;周鐘等[11]通過剖析大數據從研發到應用涉及的主體與資源要素,構建大數據產業應用生態系統。關于大數據產業生態系統發展水平的評估,趙海東等[12]結合大數據產業特征,基于創新驅動視角構建發展水平評價指標體系,并指出應從政策、文化、人才和市場等方面進行優化。在大數據產業生態系統未來發展方面,Castro等[13]認為,新穎的數據來源、大數據分析能力的提高和主體要素協作有助于實現可持續發展目標;胡登峰[14]提出通過加強數據資源管理、優化資源結構等推動系統升級。由此可見,關于大數據產業生態系統的研究沿著系統構建—發展水平—發展趨勢的過程演進。
對于產業生態系統演化路徑的研究,大多數文獻從系統主體關系或特征出發,如Tolstykh等[15]從主體共生模式和產業循環方面對系統升級進行研究;程勝[16]根據主體競合關系研究產業集群的演化穩定性;范太勝[17]基于對系統內主體間競爭關系的研究,給出從局部到整體系統穩定的演化路徑;Yang等[18]基于路徑演化理論,從產業路徑依賴特性出發,提出產業發展路徑創造機制。在演化研究方法上,從系統主體出發,Logistic模型是較常用的方法,如孫麗文等[19]從主體間競合關系出發,利用Logistic模型構建系統競合演化機制;孫冰[20]利用Logistic模型分析不同功能特性種群的不同演化路徑;Meng等[21]利用logistic模型對主體生態位進行研究,并提出不同主體間協同演化的優化策略。從系統資源出發,曾子明等[22]基于熵理論視角,從系統內外部信息交流傳遞變化研究輿情演化與風險控制;Moldavanov[23]利用熵模型研究系統內部與環境交流過程中能量變化對演化的影響;翟凱[24]指出,系統需要從外界不斷引入負熵抵消系統正熵從而朝更好的方向發展;陳丹[25]認為,開放的體系進行內外信息置換會產生熵變,并影響系統演化結果。
綜上可知,Logistic模型被廣泛用于研究主體間關系變化、種群演化規律等問題,在產業演化發展研究中具有很強的實用性。數據資源、大數據技術等是大數據產業生態系統的重要資源要素,系統間與系統主體間的資源、技術交流與交換等會對系統演化路徑產生重要影響,而熵模型多被用于探討系統熵流變化如何影響狀態改變并最終導致系統演化。上述兩種模型分別從種群主體間關系演化和資源交流程度變化角度描述系統演化規律,而生態系統種群主體關系演化過程中伴隨著資源的交流變化,兩個過程相結合才能更準確反映系統演化狀態。因此,本文將Logistic模型與熵模型相結合,從大數據產業生態系統種群特征出發,基于系統主體關系以及主體間、系統間的資源交換等研究大數據產業生態系統演化路徑。
目前大數據產業還沒有形成統一定義,學者們和政府管理部門從不同角度對其進行了界定。學界較多認為大數據產業是與大數據有關的數據資源收集、分析、存儲、組織管理及價值提煉應用等經濟活動的集合。本文基于產業管理視角,采用工業和信息化部《大數據產業發展規劃 (2016—2020年) 》對大數據產業的界定:以數據生產、采集、存儲、加工、分析、服務為主的相關經濟活動,包括數據資源建設,大數據軟硬件產品開發、銷售和租賃活動以及相關信息技術服務。
關于產業生態系統的研究,學者們主要結合生態系統思想圍繞產業集群展開[26],如Frosch & Gallopoulos[27]最早提出產業生態系統概念,指出產業生態系統是一種類似自然生態系統的循環體系,運用新的生產方式減少對環境的危害從而保持產業持續健康發展;劉則淵等[28]認為構建產業生態系統是為了在整體系統的物質能量交換過程中把握產業活動對環境與資源的影響。由此,本文認為大數據產業生態系統是由以大數據相關企業及為產業運作提供各類資源的中介機構所組成,具有能量和信息流動等特定規律且與環境協調發展,涉及數據全生命周期(數據生產、采集、存儲、加工、分析和服務等)的復雜系統。
基于生態系統理論,將大數據產業生態系統分為生物部分與非生物部分。其中,生物部分是大數據產業相關企業、中介機構等系統主體要素,非生物部分則是社會文化、市場等環境與物質能量。
大數據產業是數字經濟的重要驅動力,目前對大數據產業還未形成明確統一的分類標準,各界根據不同需要提出不同劃分方法,如二分法、三分法、五分法、六大類等,但這些分類都缺少官方權威支撐。目前與大數據產業密切相關的官方權威行業分類標準是《數字經濟及其核心產業統計分類(2021)》(國家統計局令第33號)。這一分類標準從數字經濟活動角度進行劃分,相對比較寬泛,未對大數據產業進行明晰界定,難以與企業類型直接對應,但可根據研究目標,參考這一標準對大數據產業進行細分?!稊底纸洕捌浜诵漠a業統計分類(2021)》將數字經濟核心產業劃分為數字產品制造業、數字產品服務業、數字技術應用業、數字要素驅動業和數字效率提升業五大類。前四大類屬于數字產業化部分,是數字經濟核心產業,第五大類為產業數字化部分,是數字技術與實體經濟的融合。中國信息通信研究院發布的《大數據白皮書(2021)》指出,基礎設施、數據服務、融合應用是大數據產業的三大組成部分,三者相互交融,形成完整的大數據產業內部生態,其中基礎設施和數據服務構成數字產業化部分,融合應用構成產業數字化部分。此外,政府及各類服務機構的功能是為大數據產業提供發展服務,同時大數據產業發展也受到社會、市場等環境影響,這些服務機構和環境與大數據產業一起構成完整的大數據產業生態系統。依據上述分析,本文將大數據產業生態種群劃分為3類:基礎種群、核心種群和輔助種群。基礎種群包括信息產品制造企業、信息產品服務企業和信息技術服務企業,是大數據產業運行的基礎。核心種群包括數字原生企業和數字化轉型的傳統企業(簡稱轉型企業),進一步將數字原生企業按照數據資源來源劃分為數據生產型企業和數據服務型企業。其中,數據生產型企業業務側重對自身產生的業務數據進行處理再利用,數據服務型企業業務則側重對收集的數據資源進行分析挖掘并給出分析結果與解決方案。轉型企業種群是指通過與基礎種群企業和數字原生企業種群合作,或通過引進、運用大數據技術等進行轉型升級的傳統企業。輔助種群由政府、高校、金融機構等實體組成。
如圖1所示,在大數據產業生態系統中,主體協同發展,種群間合作共生,與政策、市場等環境相互作用,實現系統內物質能量等的循環流動。

圖1 大數據產業生態系統Fig.1 Big data industry ecosystem
有“中國數谷”稱號的貴陽,作為全球超大型數據中心的密集地帶,已形成大數據產業生態系統,其核心種群包括阿里巴巴、騰訊等數據生產型企業,數據寶、華泰智遠等數據服務型企業,航天電器、海信、奇瑞萬達等轉型企業,企業間進行資源共享、技術交流與業務合作。同時,貴陽大數據產業生態系統擁有良好的基礎設施,系統基礎種群包括白山云、中國電信、中國移動等企業,建設數據中心標準機架100萬架、服務器400萬臺等。此外,國家大力支持貴陽大數據產業生態化發展,提供一系列優惠支持政策,系統內擁有貴州大學、華為大學、大數據戰略重點實驗室、貴陽大數據交易所等輔助種群主體。除擁有良好的政策環境、數據資源環境、技術環境外,貴陽大數據產業生態系統還擁有地質結構穩定、能源充足等良好的生態環境與企業運作環境。
社會對于先進技術、智慧城市的需求以及滿足需求的能力形成大數據產業生態系統的發展動力,同時市場、社會文化等環境也成為限制其發展的因素。在動力與約束共同作用下,大數據產業生態系統不斷演化,呈現出自組織特性。
(1)開放性。大數據產業生態系統是一個開放系統,社會成員間不斷進行數據交互[29],數據的存在與交流形式使得大數據產業生態系統必然是開放的。
(2)非線性復雜系統。大數據產業生態系統組成要素的多樣性決定其是一個非線性復雜系統,技術、數據資源等不同導致主體要素存在差異,這些主體要素形成不一致的高低位勢結構從而產生勢能差,在此起彼伏的位勢漲落間不斷促進系統動態演化。
(3)遠離平衡態。這一特性推進系統狀態由無序向有序轉化。大數據產業生態系統的非平衡性主要表現在大數據相關企業發展不平衡、數據資源流動不平衡、企業數字化發展不平衡3個方面。
(4)隨機漲落性。大數據產業生態系統內的隨機漲落能夠保障系統完成演化,數據的復雜性、不可預測性等因素造成主體要素狀態出現偏差,這些偏差即形成漲落,使系統遠離非平衡態,躍遷到新的穩定、有序狀態。
在大數據產業生態系統中,數據與技術的復雜性使系統狀態發生不可預測的變化,而熵是描述系統功能狀態的,在系統遠離平衡態時,正熵增加,而系統的自組織特性通過增加系統負熵抵消正熵的消極影響[30],使系統朝著良性方向演化。
大數據產業生態系統產生正熵的主要原因包括:第一,數據資源管理與使用混亂。信息技術時代產生的海量數據缺乏統一的存儲、管理和使用等標準規范,造成數據資源使用混亂和資源浪費。第二,系統內主體間競爭過于激烈,產業結構不協調。數據作為核心要素,擁有高質量數據的企業具有絕對優勢,同時也會引起主體間競爭。第三,系統內企業主體的數字化發展不平衡。系統中轉型企業種群數字化發展程度較低,企業的資源結構、生產效率差異[31]導致數據要素分布不均。系統產生負熵的主要原因:一是系統內進行數據資源交流與大數據技術學習共享,這是負熵產生的主要原因。二是政府政策支持和基礎設施完備,國家大力推動大數據產業發展,投入大量資金、人力,全面加強基礎設施建設,鼓勵企業數字化轉型。三是系統內輔助種群多樣、健全,各類科研院所、金融機構等能為大數據產業發展提供極大助力[32],增加系統朝有序化方向發展的力量。
大數據產業生態系統是以核心種群為中心,并與基礎種群和環境相互作用演化發展的,核心種群內部各種群之間的關系變化是整個系統的關鍵核心變化關系。因此,應用Logistic-熵模型重點闡述核心種群中數據生產型企業種群、數據服務型企業種群和轉型企業種群3類主體間競合關系以及資源、技術交流關系。
由上述分析可知,大數據產業生態系統的自組織特性是其演化發展的前提,系統非線性產生的主體位勢差、遠離平衡態產生的發展動力、隨機漲落性產生的遠離非平衡態動力等都推動系統演化發展,但系統內主體間競爭、資源與環境限制等抵抗因素都會改變系統的綜合狀態。Logistic模型能夠揭示不同種群特征的企業主體間關系對種群發展的影響,熵模型能闡述不同資源流動情況下的系統狀態變化。
基于大數據產業生態系統的自組織特性,本文將描述主體間競合關系的Logistic模型與體現系統資源、技術交流的熵模型結合起來,從而更完整地刻畫大數據產業生態系統的演化路徑。Logistic模型是解釋自組織系統主體間關系變化的標準模型,其方程形式如下:

(1)
其中,對于大數據產業生態系統,x為其綜合發展狀態,以系統的經濟效益體現;r為無限制狀況下系統的最大發展速率,即在沒有市場容納量限制下系統經濟效益x的增長率;M為技術水平限制下系統最高發展程度可獲取的經濟效益。
對于大數據產業生態系統而言,無時無刻不在進行數據資源與技術的流轉以及資金、能量流動,都是影響系統負熵的因素,稱為負熵流。在系統中,存在正熵(I)、負熵(E)、熵變(dS)、正熵增(dSi)和負熵流(dSe),則有:
dS=dSi+dSe
(2)
由于系統正熵是自發產生的,不可能為負值,總有dSi>0。如果dSe<0且|dSe|>dSi,則dS=dSi+dSe<0,這表明隨著負熵流增加,系統會由原來的狀態朝著更加有序的狀態發展。
在大數據產業生態系統中,熵狀態參量S=f(T,Q,V),其中T為時間,Q為系統數據資源、技術和能量等,V為數據資源、技術和能量在流動、交換或共享等生產活動中產生的相應經濟價值。在系統中,數據、技術等要素的價值最終都要通過經濟效益直觀體現,因此本文以經濟價值V表示系統內的熵,則大數據產業生態系統的熵為系統在某狀態下擁有的數據資源、技術等與其經濟價值之比。

(3)
為更直觀反映系統熵的變化,用一個時間段系統的初末態表示。

(4)

系統中數據資源、大數據技術等流轉以及主體間競合關系變化都會對系統主體經濟效益產生直接影響,因而將資源、技術等對應的經濟價值用主體最終產生的經濟效益表示。根據Logistic模型的運算規則,為方便分析,假設大數據產業生態系統中每一個具有相同數據資源特征的種群至少有兩個企業X、Y相互獨立,在t時期兩家企業的實際經濟效益分別為RX(t)、RY(t);在技術水平一定的情況下,兩家企業的經濟效益最大值分別為KX、KY,并且假設其為常數;rX、rY分別表示理想環境下效益產出水平的最大變化率。因此,在相互獨立的狀態下,企業X、Y的經濟效益Logistic方程為:

(5)

(6)
其中,根據現實經濟含義,rX、rY>0,KX、KY>0。
根據上述特性分析,利用Logistic模型對大數據產業生態系統的主體間演化進行分析,再結合熵模型綜合考慮數據資源、技術等。對于大數據產業生態系統而言,數據資源與大數據技術是產業的核心要素,對種群內企業的經濟效益只考慮數據資源、大數據技術等流轉產生的經濟價值。令Qi為系統某一變化過程中產生負熵所利用的數據資源、大數據技術,N代表末態,O代表初態,RO為系統內主體的初始經濟效益,則RO=RXO+RYO,RN為系統內主體在一段時間后的經濟效益,則RN=RXN+RYN。將Logistic模型代入熵差公式,則大數據產業生態系統內的熵差公式為:

(7)
系統負熵流大小是決定系統能否朝有序化發展的關鍵,通過對系統主體數據資源、技術交流變化及競合狀態進行分析,確定大數據產業生態系統的最佳演化狀態。
當ΔE(s)>0時,系統內正熵大于負熵,此時系統結構紊亂,系統與外界的資源交流、物質交換受到抑制,發展狀態不穩定,意味著系統朝著消極的方向演化。此時系統內有兩種情況:首先,從大數據產業生態系統整體看,Qi<0表示系統內外部缺乏資源交流。這一情形多發生于系統發展初期,此時系統內部企業急于發展自身業務,企業間數據流通較少,由于缺乏統一的數據標準,數據使用與管理混亂。同時,由于發展初期技術不成熟,業務承載范圍小,使得大數據產業生態系統與其它產業生態系統間業務合作較少,系統創新程度低。其次,從大數據產業生態系統內主體種群(企業系統)視角看,一方面,RN=RO,Qi<0或0

(8)

(9)
當σA>1且σB>1時,企業間競爭激烈,企業不存在共生平衡點,只要任何一家企業占據數據資源優勢,另一家企業就會因失去核心競爭力而退出市場。此時,ΔE(s)>0,系統末態熵遠大于初態熵,種群內資源減少、矛盾激化,導致系統結構紊亂,處于不穩定發展狀態。
可見,當正熵差時,大數據產業生態系統演化處于混亂無序狀態。系統內主體間資源交流大幅減少、競爭加劇,甚至出現資源壟斷現象,導致內部結構混亂、資金效益低下,系統無法持續發展演化。此時,如果系統通過從外界獲取數據資源、新技術等調整內部狀態,抵消正熵帶來的消極影響,當Qi≥0且QN≥QO時,系統將向零熵差狀態轉變。
當ΔE(s)=0時,系統內正熵等于負熵,此時大數據產業生態系統整體處于動態平衡狀態,系統能夠充分利用從外界獲取的資源抵消正熵的消極影響。對于企業系統來說,存在兩種情況,一方面,Qi=0且QN≥QO,表示企業沒有從外界獲取新的數據資源,自身業務產生的數據資源在內部得到利用。此時,企業處于業務發展初始階段,通過業務產生或收集的數據、技術等實現資源的循環再利用。另一方面,Qi>0,QN>QO且QN>Qi,此時RN=RO,表示一段時期內企業與外界進行資源交流共享,同時企業自身也取得技術或業務突破,但業務總盈利為零。也即,企業系統內產生大量數據資源流轉,拿出少部分資源與外界進行交流共享,但企業總體經濟效益未能即時提升,需要一定時間進行成果轉化。
當零熵差時,大數據產業生態系統演化處于整體動態平衡狀態。系統主體產生的數據資源供主體自身業務所用,主體間缺乏資源交流。但這一狀態極易發生改變,當平衡狀態發生變化時,系統演化方向也將改變。當系統停止與外界進行資源交流時,系統將朝正熵差狀態發展,但會持續增加與外界的聯系合作,加強資源共享與交流,當Qi>1時,系統將向負熵差狀態發展。
當ΔE(s)<0時,系統內正熵小于負熵,大數據產業生態系統整體結構穩定,系統內充分進行數據共享與技術交流,有序度提高,意味著系統朝健康穩定的方向演化。對于企業系統來說,存在兩種情況:一方面,QN(1-Qi)



圖2 企業A、B平衡條件Fig.2 Balance conditions between enterprises A and B
(2)數據生產型企業種群。種群內企業主體業務范圍廣,業務產生大量數據資源并利用大數據技術對其進一步分析,為消費者提供針對性服務。這類企業規模大、內部結構復雜,為提升市場份額,企業向應用服務方向發展,大力支持技術與應用創新。由于大中型企業擁有更多顧客和更優質的數據資源,促使種群內不同企業間開展業務合作,產生數據資源流轉,最后呈現出以大型企業為核心,中小型企業通過與大型企業合作進行業務聯系的現象。此時,在數據生產型企業種群中抽象出企業C、D,令X=C、Y=D,企業C、D的經濟效益Logistic方程為:

(10)

(11)
(3)轉型企業種群。轉型企業與數字原生企業進行多方面合作,利用大數據技術對傳統企業生產運作進行數字化升級,對業務進行數字化存儲與利用,對原有復雜組織結構進行優化調整。隨著政府政策支持和企業數字化轉型需求增加,呈現合作多樣化、穩定性提升、合作范圍擴大等利好趨勢。此時,從轉型企業種群中抽象出企業G,從數字原生企業種群中抽象出企業H,令X=G、Y=H,則ωG(ωG>0)表示數字原生企業H對轉型企業G的合作促進作用,企業H同理。此時,企業G、H的經濟效益Logistic方程為:

(12)

(13)
當負熵差時,大數據產業生態系統演化處于健康穩定狀態,系統內不同企業種群都能取得較高的經濟收益,主體間和種群間競爭適度、合作緊密并充分進行數據資源與技術交流共享,系統朝著多樣化、智能化等方向可持續發展。因此,負熵差是系統演化的最佳狀態,大數據產業生態系統演化路徑要以達到這一狀態為目標。
由于大數據產業生態系統是復雜系統,其演化過程通過種群子系統演化最終實現系統種群集成演化。因此,演化路徑需要從不同核心種群演化路徑和系統種群集成演化路徑兩方面分別表述,對不同核心種群演化路徑輔以企業案例進行詳細闡釋。
對于數據生產型企業種群,當熵差ΔE(s)>0時,數據生產型企業處于業務發展初期階段,企業通過自身業務獲取的數據資源較多,但由于業務分散,企業無法處理這些業務帶來的龐大數據量,與其它種群企業合作較少,種群內部狀態混亂。此時,企業需要:①加強大數據相關技術學習,擴充技術人才隊伍、學習先進大數據技術是支撐企業運作發展的核心力量;②開展業務數據聚合分析,更全面高效地分析企業運行狀態,提高業務能力;③建立企業合作關系網絡,拓寬數據來源渠道并提升業務層次。通過上述舉措增大系統Qi,當Qi≥0且QN≥QO時,種群系統內從外界獲取的可利用資源增加,企業合作關系網絡得以建立,系統向ΔE(s)=0狀態轉變。
以阿里巴巴集團為例,公司積累了數以億計的用戶與大量合作企業,其業務產生了龐大的數據量,屬于數據生產型企業。在發展初期,由于技術限制,數據存儲與利用不足,系統處于熵差ΔE(s)>0的狀態。為突破困境,阿里巴巴不斷進行人才招聘、先進數據技術學習,利用阿里云平臺對業務數據進行匯聚分析,對用戶進行精準推送,企業系統整體Qi≥0,企業開始快速發展。
當熵差ΔE(s)=0時,種群系統處于平衡狀態,由于資源缺乏與技術限制,數據生產型企業發展進入停滯期,企業的技術僅能處理當前業務產生的數據資源。此時,企業需要:①技術創新突破。通過技術創新,以更強大的數據處理能力、更高級的智能決策推動企業發展;②數據智能應用突破。基于數據智能平臺的搭建應用,對數據進行實時響應與智能交互,促進資源流動,提升企業數據獲取與使用能力。當系統Qi>1時,系統內出現新的數據資源或技術突破,業務發展迅速,系統向熵差ΔE(s)<0狀態轉變。
此時,阿里巴巴業務經過迅速發展,由于技術瓶頸、用戶高層次需求的出現,業務增速放緩。為突破技術瓶頸,阿里巴巴設立達摩院,通過吸收頂級人才與先進技術,研發出圖片數據拆解與比對技術并應用于業務場景,實現數據智能應用,企業系統Qi增大,進入快速發展階段。
當熵差ΔE(s)<0時,數據生產型企業進入快速發展階段。此時,種群系統內部建立合作網絡,業務實現多元化發展,通過與數據服務型企業進行資源、技術交流,與轉型企業加強業務合作,促進數據融合升級。同時,通過建設數據智能平臺優化企業組織結構,加強對數據資產的管理與應用,實現數據智能分析。
隨著業務不斷發展與擴張,數據資源獲取與處理顯得尤為重要。阿里巴巴與多家企業合作,如與數據服務型企業新華三集團合作建設新一代阿里數據中心,以數據推動交易服務升級,實現數據循環優化。
在數據生產型企業種群中,絕大部分數據資源來源于企業各類業務,多業務平臺的數據聚合分析能全面把握企業總體業務情況從而選取最佳業務拓展方向;以用戶、智能產品等為中心,通過線上線下等多種渠道進行數據拓展;通過數據智能化應用提升用戶對企業的信任與依賴,推動企業業務發展。最終形成業務數據集聚—多渠道數據拓展—數據智能化應用的數據生產型企業種群演化路徑。
對于數據服務型企業種群系統,當熵差ΔE(s)>0時,企業處于發展初期階段,企業間對數據資源的爭奪激烈,阻礙種群系統與外界資源交流,系統內數據資源分配不均甚至產生數據資源壟斷現象。此時,政府需要實施反壟斷政策,維持良好的市場環境;制定企業發展優惠政策,支持新生企業加入,增加主體多樣性。同時,企業需要實施數據云聚合,提升自有數據資源占比,通過云平臺的建設,大量、高效進行數據聚合處理。在政府與企業共同調節下,系統負熵流增加,當Qi≥0且QN≥QO時,系統可利用數據資源增加,資源的收集、存儲能力大幅提升,企業自有數據資源占比高于業務供給的數據資源,系統向ΔE(s)=0狀態轉變。
以新華三集團為例,公司利用大數據技術提供數據優化方案等服務,屬于數據服務型企業,在發展初期,企業為擴大市場份額,與同行業企業進行資源競爭。為提升企業競爭力,企業設計了業界首款云化集群路由器,將數據匯聚云端,系統整體Qi≥0,企業開始快速發展。
當熵差ΔE(s)=0時,數據服務型企業處于業務發展停滯期,系統內數據資源被循環利用,但由于缺少更高層次的數據資源與技術支撐,系統創新性不足。此時,企業需要:①加強合作交流,保證資源的多樣性并通過技術提升進行創新突破;②促進高質量數據融合,對來源相近、特征相似的數據進行融合升級;③推動數據資源資產化,將數據資源內化為企業數據資產。當Qi>1時,系統主體合作網絡建設完備,具有更高層次的數據資源或創新性技術開發,數據資源內化形成一定規模的數據資產,系統負熵流增加,系統向ΔE(s)<0狀態轉變。
隨著市場上同功能產品增多,新華三集團業務發展放緩。為打破業務停滯的局面,2018年公司提出融合平臺戰略,加快數據融合,并將數據資源管理提升為數據資產管理,系統Qi>1,企業進入業務快速發展階段。
當熵差ΔE(s)<0時,數據服務型企業系統結構穩定,處于業務快速拓展階段。此時,通過與數據生產型企業種群進行技術合作與資源共享,與轉型企業種群合作獲取更多元化的數據資源并對其進行集聚、融合處理,使之成為企業數據資產。
這一階段,新華三集團業務快速發展,推出智能數字平臺等產品,成立智能事業群,發布智能戰略,并與阿里巴巴、中國鐵路工程集團等合作,為其提供智能設備與服務,獲得大量數據資源并形成業務數據資產。
在大數據產業生態系統演進過程中,數據服務型企業以大數據云存儲處理中心建立為基礎,進行多渠道數據聚合,推動具有相似特征的高質量數據融合,為業務對象提供更高層次的決策意見,并將數據資源建設成為企業數據資產,形成數據云聚合—高質量數據融合—數據資產化的數據服務型企業種群演化路徑。
對于轉型企業種群,當熵差ΔE(s)>0時,轉型企業處于業務信息網絡化變革階段,業務處理方式單一、效率較低,與其它種群企業缺乏技術合作與資源交流。此時,政府需要通過政策支持、舉辦數字化培訓等引導企業轉型。轉型企業需要進行信息化變革,通過引進信息技術設備、加快信息系統的推廣與應用等。同時,增加與其它種群的合作交流,促進數據資源共享交流。當Qi≥0且QN≥QO時,轉型企業種群與其它企業種群間建立合作關系,通過業務帶動企業信息化變革,促使業務數據由碎片化轉向集中化,朝數字化方向快速發展,系統向ΔE(s)=0狀態轉變。
以中國鐵路工程集團(簡稱中國中鐵)為例,中國中鐵是集多項業務于一體的綜合型建設集團,也是轉型企業的典型代表。中國中鐵經歷基建行業的高速發展,行業產能趨于飽和,于2015年成立管理與技術研究院,向數字化轉型發展,通過信息化系統的應用等將傳統基建業務信息化,促進業務數據聚合、流通,使系統整體Qi≥0。
當熵差ΔE(s)=0時,轉型企業處于轉型發展停滯階段,存在兩種可能:一是企業自身進行數字化改革升級,但僅滿足企業原有業務需求;二是與數字原生企業建立數字化轉型合作聯系,但整體業務交付與數據共享程度不高。此時,企業需要持續進行組織架構調整與業務數字化流程再造。同時,通過技術合作,利用云平臺對企業數據資源進行聚合處理,提升數據資源利用率與決策效率,實現業務突破。當Qi>1時,企業持續進行數字化業務流程再造,實現業務數據在云端的實時調用與操作,整體實現數字化管理,系統向ΔE(s)<0狀態轉變。
隨著中國中鐵的業務體量增大和全球化布局加快,數據資源不斷豐富,但技術停滯無法支持業務擴展與快速響應,導致資源利用率低。為提升業務效率,中國中鐵與新華三集團合作建設“中鐵云”,對業務流程進行數字化再造,向數據資源云化管理邁進。同時,與阿里巴巴合作,利用大數據等技術促進高鐵網與互聯網融合,提升數據資源利用率,企業系統Qi>1,“數字中鐵”向“智慧中鐵”發展。
當熵差ΔE(s)<0時,轉型企業向服務應用智能化快速發展,并與其它種群企業進行充分的技術交流、數據共享,通過設立信息部門促進各系統融合升級,向企業智能決策管理方向發展。此時,轉型企業的數字化程度最高。
2021年,中國中鐵建成啟用世界上單體最大的智能化盾構裝備產業園,由數字化向智能化快速發展。中國中鐵利用大數據智能控制等技術打造智能生產車間,由“制造”向“智造”轉變。
轉型企業信息技術設備的引進、信息部門的設立等是企業轉型發展的前提;數字化流程再造與業務重組使轉型企業由信息化向數字化演進;大數據云存儲處理中心建立、業務數據融合和數據智能化應用使轉型企業再由數字化向數智化演進。企業系統整體實現融合發展,最終形成業務信息網絡化—流程再造數字化—服務應用智能化的演化路徑。
由上述分析可知,不同核心種群存在不同演化路徑,種群主體間相互聯系、協調發展,朝著負熵差狀態演化。不同演化路徑在每一階段都影響著系統整體狀態,核心種群演化路徑的集成以及基礎種群、輔助種群與環境的演變共同形成大數據產業生態系統的整體演化路徑,即種群集成演化路徑。
當熵差ΔE(s)>0時,Qi<0、RN≤RO,大數據產業生態系統處于發展初期階段,各種群系統都處于主體結構混亂、資源交流共享程度低的狀態。核心種群主體間資源交流匱乏,數據收集處理能力弱,發展不穩定,基礎種群主體創新性不足,技術與設備落后導致基礎設施建設不完善,且輔助種群主體多樣性不足。
此時,大數據產業生態系統經濟效益低下,政府需投入大量資源對系統進行調控,市場、技術等環境較差。為促進主體間資源交流,應對龐大數據量的存儲處理,大數據云存儲處理中心的建立成為系統整體演化的第一步,種群間通過大數據云存儲處理中心直接對聚合的數據進行共享交流。同時,以需求驅動基礎種群進行技術學習,提升產品制造、服務應用等能力。當Qi≥0且QN≥QO時,大數據云存儲處理中心的建立使數據資源利用率大幅提升,大數據交易所等輔助種群主體增加,系統資源、政策等環境轉好,系統內負熵流大幅增加,系統狀態向熵差ΔE(s)=0轉變。
當熵差ΔE(s)=0時,大數據產業生態系統處于快速發展的停滯階段。由于數據與技術發展停滯、資源交流網絡固定,各種群系統達到平衡狀態,系統整體缺乏活力與動力。
此時政府鼓勵新生企業加入,隨著主體增加,數據來源渠道與種類相應增加,各種群通過數據融合擴展促進多渠道平臺數據的集聚,增加系統負熵流。大數據交易所、中介服務組織等積極加入,增強系統穩定性,市場等環境逐漸優化。當Qi>1時,系統內數據源增加,應用層次提升,主體增多,輔助種群功能完備,系統狀態向熵差ΔE(s)<0轉變。
當熵差ΔE(s)<0時,大數據產業生態系統處于智能化持續發展階段。系統內形成良好的數據資源交流等渠道,系統數字智能化水平提升,實現數據資源的智能處理與分析。系統內核心種群主體結構穩定、合作交流緊密。基礎種群企業的產品、技術成熟,基礎設施不斷完善。輔助種群主體多樣化發展,系統經濟效益持續提升。此時,系統負熵流不斷增加,系統朝著健康良好的方向可持續演化。
大數據產業生態系統達到元素多樣、主體交流緊密的可持續發展狀態,是整體創新性強、智能科技化程度高且結構穩定的經濟循環大系統。如圖3所示,大數據產業生態系統形成大數據云存儲處理中心建立—數據融合擴展—數智化應用的演化路徑。
根據調研企業觀研天下發布的數據,我國大數據產業融合應用發展迅速,互聯網企業線下業務的數字化轉型占大數據產業行業應用的45%;大數據產業的融合應用不斷為系統增加數據資源流動,大數據產業規模逐年擴大,2022年有望超過1.4萬億元,年均復合增長率超過30%。可見,我國大數據產業生態系統的可利用數據資源將持續增加,即Qi>1且RN?RO。因此,當前我國大數據產業生態系統總體處于熵差ΔE(s)<0的狀態,系統沿著大數據云存儲處理中心建設方向發展。為提升數據質量,需要進一步通過數據融合擴展提升數據功能層級。此外,隨著科技進步和人們生活需求升級,系統將進入數據智能化應用發展階段。但由于市場的限制和經濟發展的動蕩性,同時穿插著熵差為零的發展停滯期。在兩種狀態交錯發展的情況下,需要不斷學習新技術,發展大數據產業融合應用,擴充大數據人才資源,保持與系統外界的資源交流,這是系統發展的重要推動力與負熵的重要來源。同時,需要通過增加核心種群與輔助種群主體提升系統韌性,通過政策調控穩定市場環境。
本文通過分析大數據產業生態系統的組成要素及結構模型,剖析系統特性,并結合Logistic模型與熵模型,研究大數據產業生態系統中不同數據特征種群的演化路徑,進而研究大數據產業生態系統整體演化路徑。得出如下主要結論:首先,依據生態學理論,結合大數據產業與產業生態系統,對大數據產業生態系統進行界定,并構建系統結構模型。其次,根據數據來源不同,將大數據產業生態系統中主體劃分為數字原生企業和轉型企業,其中數字原生企業細分為數據生產型企業和數據服務型企業。最后,利用Logistic-熵模型對不同特征種群進行演化狀態分析,得到系統演化路徑要以達到負熵差狀態為目標。在此基礎上,得出不同企業種群和系統集成演化路徑:數據生產型企業業務數據集聚—多渠道數據拓展—數據智能化應用演化路徑、數據服務型企業數據云聚合—高質量數據融合—數據資產化演化路徑、轉型企業業務信息網絡化—流程再造數字化—服務應用智能化演化路徑以及大數據產業生態系統大數據云存儲處理中心建立—數據融合擴展—數智化應用種群集成演化路徑。

圖3 大數據產業生態系統演化路徑Fig.3 Evolution path of big data industry ecosystem
通過上文分析,大數據產業生態系統在負熵差時達到最佳演化狀態,為增加負熵流抵消正熵的消極影響,提出如下政策建議:
首先,制定關于數據資源等核心資源要素的反壟斷政策。通過出臺反壟斷政策維護數據資源公平競爭的市場秩序,激發企業技術創新活力,避免因企業過度競爭導致的系統混亂狀態。
其次,對于數據生產型企業,政府牽頭聯合企業建立業務數據共享平臺,制定企業核心隱私數據保護法規,促進多平臺業務的數據聚合與安全共享,幫助處于正熵差狀態的企業向負熵差狀態發展;組織技術交流座談,制定技術創新補貼與獎勵政策,幫助企業突破零熵差狀態;加強基礎設施建設,帶動輔助種群發展,助力完善數據智能應用場景,推動企業向負熵差狀態發展。
再次,對于數據服務型企業,政府要制定統一的數據規范標準,提升數據處理效率與管理能力;開放企業對社會生產生活的非涉密碎片數據收集權限,為企業提供豐富的數據資源,增加負熵流;制定數據資產化標準,推動企業數據資產建設,促進數據資源吸納,向負熵差狀態發展。
最后,對于轉型企業,政府通過確定重點示范企業,以點帶面,推動傳統企業向轉型企業發展;制定轉型企業幫扶政策,劃分片區,建立片區內高數字化企業對轉型企業的幫扶聯盟,給予參與幫扶的高數字化企業優惠政策,促進企業間業務合作。