周 磊,方 芳
(1.武漢紡織大學會計學院,湖北 武漢 430200;2.武漢大學信息管理學院,湖北 武漢 430072)
創新是經濟長期發展的原動力,也是學術研究和國家政策規劃的關注焦點。自熊彼特提出創新的概念以來,創新動力主題的經典研究相繼提出了技術推動論、市場拉動論、技術與市場的耦合互動論、一體化模式、系統集成與網絡模式等理論,逐步廓清了技術、需求等要素在推動創新中的重要作用。同時,黨和國家歷來高度重視創新在國家經濟發展、產業安全中的戰略性地位。黨的十九大報告提出加快建設創新型國家,要引領原創成果重大突破,突出顛覆性技術創新。國家“十四五”規劃進一步要求,強化國家戰略科技力量,提升企業技術創新能力。目前,產業核心關鍵技術和重大科技創新的技術復雜性、學科交叉性、市場不確定性特征愈加顯著,使得創新模式由傳統的內部研發向合作開發、開放式創新、創新生態系統轉變。因此,建立供需精準對接機制是實現創新要素按需配置的前提。鑒于此,本文以對接產業創新需求為目標,綜合利用文本挖掘、文獻計量、DEA模型等方法,建立三階段的創新主體識別框架,以期為優化產業協同創新研究和實踐提供幫助。
跨組織創新是企業創新的重要模式,外部創新主體選擇已成為企業管理研究的重要問題。相關學者根據企業競爭優勢的來源,提出了基于資源基礎觀的資產指標、基于核心能力學說的動態能力指標、基于知識管理理論的專有性知識指標、基于戰略管理視角的企業戰略優勢指標等。在此基礎上,研究者針對上述指標設計了創新主體評價體系,并利用決策理論和方法對各指標進行合理賦權。早期評價方法以AHP模型、模糊綜合評價等專家介入法為主。后續研究充分吸收決策理論量化方法,整合Theil不均衡指數和灰色關聯度系數形成組合賦權灰色模糊評價法[1];使用Dematel-ANP法對開放式協同創新合作伙伴選擇指標進行賦權[2];使用熵權Topsis法選擇跨產業研發合作伙伴[3];組合AHP法與熵值法對創新合作伙伴選擇評價指標體系進行賦權[4]。近年來,伴隨著經濟全球化和創新多元化趨勢進一步凸顯,跨組織創新合作的范圍、強度、速度也隨之變化。因此,創新主體識別研究應加大對其他學科先進分析方法和思路的吸收。
一是要吸收文本挖掘技術提升需求分析的自動化程度。不同于問卷調查、專家咨詢法等傳統方法,情報學領域利用信息采集、清洗、分析一體化工具,實現了針對互聯網批量需求信息的自動獲取和深度挖掘。相關研究始于高度專業化人才的招聘,分專業建立技能詞典[5-6],利用文本挖掘技術分析專業、崗位、知識點的三層映射關系,總結出計算機專業人才的技能需求[7]。新興研究引入Agent仿真模型,研究合作伙伴選擇策略并評估創新成果[8];利用word2Vec模型分析專利相似性進而判斷產品用途,從而識別潛在技術機會及合作企業[9];利用自監督表示學習識別企業偏好、技術融合機會,進而根據企業間相似性、企業和融合機會相似性做出合作決策[10]。因此,創新主體識別研究應引進情報學的文本挖掘技術對創新需求進行深度理解和自動聚類,從而為匹配創新供給主體奠定基礎。
二是在文獻數據及其計量方法的基礎上,增強對多源信息的綜合化分析。近年來,情報學領域積極采用異構數據開展技術創新主題的融合性研究。例如,利用論文和專利數據確定研究領域科研和創新演化的協同性[11-12],識別發明科學家或學界企業家[13],發現潛在的商業化機會[14];利用專利和商標網絡建立主題模型,提高新穎性、創造性技術的商業化概率[15];綜合論文、專利、新聞數據探索固體油脂納米顆粒的技術轉移路徑和新興研究方向[16];綜合專利和交易許可數據,利用主題模型和生存分析對衛生健康類創新的商業可行性進行預測[17]。因此,創新主體識別研究應借鑒情報學的異構數據分析方法,通過多源信息的交互印證對潛在供給方法進行全面考察。
三是在深耕科研環節的基礎上,加強對創新鏈各環節的關注。目前,情報學研究日益重視技術創新的經濟效應,實證發現具有影響力的專利知識對企業財務績效存在滯后一期且為期一年的正向影響[18]。國內情報學界亦積極開展金融情報學探索性研究,對我國上市公司年報信息質量進行了綜合評價[19],對標美國提出我國上市企業年報產品的信息組織優化策略[20];應用文本挖掘技術抽取企業風險條目[21]和預測企業破產風險[22];建立了金融風險知識關聯原型系統[23]及金融知識可視化模型[24]。因此,創新主體識別研究應借鑒金融情報研究視角,分析創新主體貫穿研究、技術化、商業化全流程的創新行為。
綜上所述,創新主體識別的評價指標體系及評價方法成果豐富,但也存在亟待吸收、學習、優化的地方:一是產業創新需求被視作一個整體性的黑箱,未對其內部結構和特征進行定量化剖析;二是評價體系聚焦于科研環節,即重視供需雙方的創新內容匹配,而對創新者效率的關注有限;三是單一數據源和傳統評價方法難以完全適應未來研究對技術工具自動化、數據多源化、視角綜合化的要求。因此,本文將從兩個方面完善創新主體識別機制:一是從內容、效率二維視角豐富創新主體識別內涵。本文建立了“以需求識別為前提、內容匹配為基礎、效率評價為進階”的識別框架。二是增強研究方法的包容性和特色化。本文在經典的文獻計量基礎上,以網絡數據為數據源,利用LDA主題建模技術從中挖掘需求主題;以企業年報數據為數據源,利用DEA方法評價企業創新效率。
針對當前研究的不足,本文整合多源數據,綜合應用文本挖掘、專利計量、DEA等方法,建立三階段的創新供需識別框架:第一階段利用文本挖掘技術識別產業創新需求;第二階段針對潛在的創新供給主體,利用文獻計量方法分析其創新專長,實現創新內容的匹配;第三階段利用DEA方法評估供給方創新投入—產出情況,實現創新效率的篩選。具體分析流程如圖1所示。

圖1 本研究的分析思路
情報學研究常用的文本挖掘方法有TF-IDF算法、SAO結構分析、LDA建模。TF-IDF算法克服了早期的詞向量模型僅考慮絕對詞頻的缺陷,能夠發現集合中真正重要的詞匯。SAO結構分析區別于詞袋模型,將詞性和句法結構融入文本分析,是技術—功效矩陣自動化的重要工具。2003年,Blei等提出隱狄利克雷分配(Latent Se?mantic Analysis,LDA)主題模型,建立了連接文檔、主題、詞匯的多層次貝葉斯概率模型,實現高維度文檔向低維度語義空間的完全隨機映射[25]。LDA模型采用無監督學習機制,將文檔集自動聚類為指定數量,并給出每一類文檔集的特征詞及其概率分布,分析過程如圖2所示。

圖2 LDA建模思路
圖2中涉及的參數包括:主題數K、文檔數M、文檔—主題的多項式分布先驗參數α、主題—特征詞的多項式分布先驗參數β;Nm是第m個文檔的特征詞數量,θm為第m個文檔的主題分布,φk是第k個主題的特征詞分布。LDA建模的工作機制可簡單描述為五步:第一,從現有的M個文檔中獲得N個特征詞,設置主題數K。第二,以先驗參數α生成滿足θ的文檔—主題多項式分布。第三,針對選定主題Z,以先驗參數β生成滿足φ的主題—特征詞的多項式分布。第四,根據特征詞的分布,采樣生成具體特征詞W。重復以上過程,直到整個文檔中的每一個詞都被追蹤到。第五,得到文檔—主題的分類,以及各主題—特征詞的分類。
產業創新需求挖掘的預期結果是以關鍵詞組合形成若干主題,適合以LDA建模實現,具體執行過程分為三步:首先,對需求文本進行初步分詞,人工分析后,修改分詞詞典、停用詞詞典,再進行二次分詞。其次,對二次分詞后的文本進行LDA建模,并根據困惑度(perplexity)或輪廓系數(silhouette)指標確定最優分類數N。最后,分析最優分類結果,綜合行業背景、關鍵詞和概率,為創新需求命名。
創新鏈是科學知識、技術知識經過技術創新轉移轉化實現商業化、產業化的過程[26],通常包括新思想產生、基礎研究、技術研發、產品試制、大規模生產、市場營銷等多個環節[27]。創新鏈各環節的發展動力各異,其需求的創新屬性亦有所不同??蒲协h節位于創新鏈上游,對應的需求多與學科理論研究相關,創新供給方主要是高等院校。因此,本研究需要對高校的論文、科研項目、成果獲獎的主題進行分析,判斷其是否滿足創新需求的內容要求。預研和開發環節是科學研究向應用開發轉化的基礎。例如,武器裝備領域在武器裝備具體型號開發前,通過預研環節來解決和落實各項關鍵性技術問題。該階段的創新供給方主要為研發能力突出的大型企業、專業能力突出的研究所。例如,華為公司于1998年成立了預研部,專門負責前瞻性技術的開發。因此,本研究需要對企業、研究所的專利技術進行分析,判斷其是否滿足創新需求的內容要求。制造環節位于創新鏈的下游,需要調動各類物質資源組織生產。企業是這類創新的潛在供應方。因此,本研究需要對企業主要業務、產品系列、解決方案等進行分析,判斷其是否滿足創新需求的內容要求。
創新內容匹配主要考查供給方產出與采購方需求的一致性。對于滿足創新內容要求的潛在供給方,還要從投入、產出的因果關系出發,評估其創新效率,從而達到“優中選優”的目的。國內研究主要采用DEA、隨機前沿分析法(SFA)等決策模型評價企業技術效率。考慮到DEA能夠對多目標進行決策,且無需專家介入、對數據分布無特殊要求,本研究將使用該方法對供給方的創新效率進行綜合評估,線性規劃建模如下。
本文設有n個機構滿足創新內容要求,每個機構投入m種資源,獲得p種產出,xij(>0)表示第j個機構的第i種指標的投入量,yrj(>0)表示第j個企業的第r種指標的產出量,vi(≥0)表示第i種投入指標的權重,ur(≥0)表示第r種產出指標的權重。針對高校和研究所,本文主要將專職教師規模、重大實驗設備、科研經費等作為創新投入;將論文、專利、獲獎等指標作為創新產出。針對企業,本文將人力資本、資金、技術作為創新投入;考慮到企業承擔了更大的市場風險、制造成本、資金墊付成本,因此,在衡量創新資源配置效率時應綜合考慮創新產出、資金鏈穩健性。
本文采用C2R模型測試企業資源配置效率的相對有效性,最優化模型如式(1)所示:

若hj=1,表明主體j資源配置有效,滿足創新效率要求;反之,說明主體資源配置的綜合效率偏低,難以持續保障創新活動。
國防科技工業涵蓋航天、航空、船舶、電子等多個行業,具有典型的集中采購特征。創新供給方需要按照需求清單提供定制化產品或服務。本文以全軍武器裝備采購信息網為數據源,利用網絡爬蟲采集預研板塊截至2019年的需求信息,共2 047條。
按照上文步驟,本研究對預研需求文本進行清洗、分詞和LDA主題建模。輪廓系數指標顯示,N=9時,組內內聚性和組間差異度指標最佳。根據前10個關鍵詞及分布概率,本文對9個需求類別分別命名,如表1所示。

表1 國防科技工業預研環節的創新需求主題建模(N=9)
根據需求主題的內在關聯性,本文將上述9個主題進一步歸為5個大類:一是材料類需求,由主題3、6構成,涉及儲能相關材料、陶瓷復合材料、高性能涂層、納米尺度材料等;二是飛行器與船舶類需求,由主題1、2構成,包括航天器抗干擾、衛星在軌探測、船線型優化與海洋目標辨識等;三是信息通信與智能分析類需求,由主題8、9構成,包括網絡通信協議、信息管理方法、系統仿真與建模;四是電子元件類需求,由主題4、5構成,主要為高性能電子元器件需求,如各類芯片、傳感器等;五是軟科學類需求,對應主題7,主要為國防知識產權制度、數據庫建設。
前文指出預研環節對應的創新主體為企業和研究院。綜合考慮國防科技工業創新主體的資質要求和信息可獲得性,本節以我國十大軍工集團的61家上市公司作為預研需求的潛在供給方。首先,以國泰安CSMAR數據庫為起點,根據上市公司股票代碼查詢企業全稱;其次,以inco?Pat專利數據庫為數據源,采用基于企業全稱的權利人擴展策略檢索專利;最后,對各上市公司專利文本進行聚類,與創新需求進行匹配。匹配結果顯示,軟科學需求無針對性企業;共有33家上市企業能夠滿足其他4類需求。接下來,本文從創新需求、創新專長兩個維度繪制熱度圖,如圖3所示。子圖中每一個方格中的數值表示特定企業滿足特定需求的專利數量,隨著數值的增大,方格的顏色按照黃、綠、藍的順序逐步加深。

圖3 國防科技工業預研環節供需對接情況
由圖3可知,共有33家企業的專利內容匹配創新需求。具體來看,7家企業的專利主題屬于第1類(材料類)需求;8家企業的專利主題屬于第2類(飛行器與船舶類)需求;17家企業的專利主題屬于第3類(信息通信與智能分析類)需求;13家企業的專利主題屬于第4類(電子元件類)需求。進一步觀察方格顏色,本文發現各類需求的對接程度也存在較大差異。對接第3類需求的專利最多,申請量為12 217件,代表性企業有??低暎?02415)、杰賽科技(002544)、航天信息(600271)。對接第4類需求的專利次之,申請量為4 899件,代表性企業有中航光電(002179)、航天信息(600271)、四創電子(600990)。對接第2類需求的專利名列第三,申請量為1 677件,代表性企業有洪都航空(600316)、航發動力(600893)、中直股份(600038)。對接第1類需求的專利偏少,申請量為854件,代表性企業有杰賽科技(002544)、中國動力(600482)、樂凱膠片(600135)。需要注意的是,上述企業的專利均與軟科學類需求無關。
本節將上述33家企業的投入產出效率進行比較,以達到“優中選優”的篩選目的。根據前文的理論分析,下文將從人員、技術、資金三個方面衡量企業投入,從創新成果產出、資金鏈保障兩個方面衡量企業產出,具體指標如表2所示。

表2 企業創新效率評估指標
為了與需求分析的時間窗口保持一致,本節對2019年企業創新效率進行評價。變量y1的取值來自incoPat,其余變量的取值來自CSMAR。預處理時發現有兩種情況不滿足DEA建模前提:一是y1j=0,表明該企業在2019年未申請專利,無技術發明產出;二是y2j<0,表明該企業在2019年經營活動未產生積極的經濟后果,進一步削弱其資金墊付能力。刪除初始數據不滿足的9家企業,納入DEA建模的企業共有24家,符合的最佳要求。DEA分析結果如表3所示。

表3 基于DEA的企業創新效率評估
由表3可知,創新資源配置達到有效水平(生產率=1)的企業共6家,分別為華錦股份(000059)、??低暎?02415)、光電股份(600184)、洪都航空(600316)、航發科技(600391)、華東電腦(600850)。這6家企業即為通過內容、效率雙重篩選的創新供給方。
接下來,借鑒Choi Y 等(2021)[28]提出的創新生態系統框架圖描繪創新供給方的技術圖景,用以揭示上述企業利用專利技術對接國防科技工業預研需求的路徑。該文提出了特定技術領域中由技術主題和關鍵機構共同組成的企業、專利、技術類三層網絡,網絡各層內部關系均由專利CPC分類號共類關系決定。由于本文涉及6家企業,大量專利難以在有限空間進行全面展示,故而對該研究框架進行了優化,將專利類、技術類兩層合并為技術層,目的在于展示創新供給方的技術特征;同時,增加產業創新需求層以展示行業需求的主題分類;最后,考慮到上述企業間的交叉權屬關系,還增加了企業權屬關系層以展示由社會資源嵌入帶來的企業間合作渠道。根據以上設想,本文繪制了國防科技工業預研環節的創新供需對接路徑,如圖4所示。

圖4 國防科技工業預研環節的創新供需對接路徑
由圖4可知,最終篩選出的6家企業的創新供給模式主要分為聚焦化、多元化兩類。聚集化模式指企業利用現有創新專長重點對接一類需求。采用該模式的企業包括華錦股份(000059)、??低暎?02415)、華東電腦(600850)。華錦股份擁有的鋰電池隔膜專利技術可以對接儲能材料需求;海康威視(002415)擁有的圖像融合、分布存儲、智能分析專利能夠對接圖像數據采集、分析一體化需求;華東電腦(600850)擁有的數據中心專利技術可以對接通信系統類需求。多元化模式指企業利用現有創新專長同時對接多類需求。采用該模式的企業包括光電股份(600184)、洪都航空(600316)、航發科技(600391)。光電股份(600184)擁有的電子經緯儀和圖像儀專利技術、黑色陽極氧化專利技術分別對接高端光電儀器設備、材料類需求;洪都航空(600316)擁有的arinc429、航電系統專利技術分別對接航空元件、飛行器、信息通信需求;航發科技(600391)鎳涂層、航空發動機專利技術分別對接材料類、飛行器類需求。
此外,鑒于隸屬于同一控制人的上市企業間更容易達成戰略聯盟或合作“默契”,圖4底層還從社會資源嵌入視角揭示出6個創新主體間的潛在合作渠道。具體來看,華錦股份(000059)和光電股份(600184)同屬于中國兵器工業集團,??低暎?02415)和華東電腦(600850)同屬于中國電子科技集團,洪都航空(600316)隸屬的中國航空工業集團持有航發科技(600391)母公司中國航空發動機工業集團6%的股權;同時,上述4個集團的實際控制人均為國務院國資委。因此,鑒于國防科技工業創新復雜性和規模性、國有企業間交易成本優勢,上述6家企業還可充分利用社會資源嵌入條件,形成具有規模效應和范圍經濟的創新供給合作渠道。
本文基于內容、效率二維視角,融合文本、文獻、財務數據等多源信息,建立包括創新需求識別、創新內容匹配、創新效率篩選三階段的創新主體識別機制?;谠撗芯靠蚣埽疚膶揽萍脊I預研環節進行實證研究,發現該環節的創新需求集中于材料、飛行器與船舶、信息通信與智能分析、電子元器件、軟科學5類;進而以61家相關上市企業為潛在創新供給方進行匹配,發現有33家企業的專利滿足前4類創新內容需求,但其中僅有6家企業通過創新效率篩選;最后,為最終選出的6家企業建立創新生態系統,發現其創新供給模式分為聚焦化、多元化兩類,且這6家企業相互間存在廣泛的社會資源嵌入關系,可以形成合作性的創新供給渠道。
綜合來看,本文的理論貢獻集中體現為兩點:一是從內容、效率二維視角完善創新主體識別思路,并將其分解為“需求識別、內容匹配、效率篩選”環環相扣的三個階段;二是根據創新主體識別流程的特性,在傳統文獻數據的基礎上引入網絡文本、財務年報數據,建立了融合LDA、文獻計量、DEA的綜合分析方法體系。同時,鑒于本文的實證研究集中于預研環節需求且僅考慮了企業的創新成果形式和創新效率特征,建議未來研究覆蓋創新鏈的更多環節,并根據對應環節創新供給方的成果特征和評價導向開展創新主體識別實證研究。
最后,本文的實證研究亦能為十大軍工集團旗下上市公司的科技創新工作提供建議啟示。首先,企業創新專長與國防科技工業創新需求間的關聯性仍有待增強。上述企業脫胎于軍工集團,但改制后近一半企業的技術專利集中于部件、配件加工或民品制造,無法滿足創新內容要求;另一半企業擁有的專利集中于信息通信與智能分析、電子元件領域,對國防科技工業的飛行器與船舶、材料類、軟科學需求支撐有限。因此,未來我國應繼續引導和鼓勵企業走內涵式發展道路,根據國防科技工業創新需求,調整軍品和民品比例、優化技術結構和專利管理流程。其次,企業創新效率仍有待提升。滿足創新內容要求的上述企業中,27%的企業在2019年未申請專利或經營業務無法帶來資金凈流入;還有55%的企業在2019年的創新投入與產出間未達到有效水平。因此,未來企業應將技術發明、技術商品化納入企業年度績效評價目標,激勵企業提高創新活動的投入—產出效率。最后,創新主體服務國防科技工業創新的路徑應當多樣化。一方面,企業可以根據自身創新專長獨立對接部分創新需求;另一方面,國防科技工業具有資源投入大、技術集成領域廣、技術競爭激烈等顯著特征,武器裝備總體和關鍵分系統的研發制造需要多個創新主體合作參與。因此,企業應充分利用股權性質帶來的社會接近性,建立競爭力強、穩定性高的有效合作機制。