瞿輝 吳位剛
摘要:新常態下,作為我國產業創新發展主要支撐條件的公共知識服務體系建設發揮著越來越關鍵的作用。其中,如何精確把握產業(特別是企業)發展過程中的知識需求問題是建設科學有效的公共知識服務體系面臨著主要挑戰。本文提出基于知識關聯網絡的企業知識需求識別方法,以期進一步提升公共知識服務的針對性和精準度,助力我國公共知識服務體系建設工作。
關鍵詞:知識關聯網絡;企業知識需求;識別方法
中圖分類號:F27;TPl82 文獻識別碼:A 文章編號:1001-828X(2017)001-0000-02
引言
知識經濟時代,知識資源已成為促進社會經濟發展的核心要素,對其的有效獲取及利用能力已成為企業提高競爭力和創新力的關鍵。[1]從產業發展演化角度而言,正確把握產業空間中知識資源分布演化的內在邏輯和動力機制是提供有效產業知識服務的基本前提[2];而其中的首要問題是如何有效識別經濟主體(企業乃至產業)的知識需求。因此,本文提出基于知識關聯網絡的相關理論和技術來識別企業的知識需求,力圖從伴隨產業經濟客觀發展實際的知識表征角度來理解相關問題,以期更好地推動我國知識服務體系的建設。
一、知識關聯網絡
1.知識關聯。知識關聯(knowledge association)指的是廣泛且客觀存在于不同知識單元(knowledge unit)之間的各種聯系的總和。[3]由于知識并不能離開其依存的物質載體而獨立存在,因此在實際研究過程中,一般使用知識載體來指代知識單元,并將知識載體之間的關系作為替代來表征知識關聯。其內涵可作如下表示:定義UI={U1,U2,U3,…,Ui}為同一類型知識載體Ui的集合,定義UJ={U1,U2,U3,…,Uj}為另一類型知識載體Uj的集合,其中,UI∩UJ為空;由此,可以將知識關聯KA表示為UI的子集UIsubset與UJ的子集UJsubset之間的共現關系(co-occurrence relation),其一般性表示如表1所示。從具體的關聯規則上來講,知識關聯是一個異常復雜的集合,幾乎難以對其進行分類。學界目前所采用的方法,主要是回避對具體關聯類型的細分而集中去進行更具普遍性的關聯規則挖掘之上,這方面的代表性研究可以參考Hipp[4]、Vaidya[5]以及 Qian[6]等人的研究,限于篇幅這里不再贅述。
根據事物普遍聯系的客觀原則,知識關聯既可以用來揭示知識單元之間的一般性聯系,也可以幫助人們通過這些聯系來發現知識單元及知識主體之間所具有的特殊關系,并將其應用到知識管理與服務的實踐中去。由于獨立的知識關聯本身并不能夠提供多少有用的信息,實踐中還需要將不同的知識關聯進行疊加,已建構出更具語義知識揭示能力的知識關聯網絡(knowledge association network)。
2.知識關聯網絡。廣義的知識關聯網絡是指由不同知識節點(若為知識單元則成為狹義知識關聯網絡)以及不同知識關聯所共同構成的復雜語義網絡,根據構成網絡中知識節點是否屬于同一類型,可以將知識關聯網絡分為異質性知識關聯網絡(表2)以及同質性知識關聯網絡(表3)兩種類型。表2中,橫、豎分別為不同類型的知識節點集合,而表3則是由相同類型知識節點所構成。對于同質性知識關聯網絡的研究目前已經非常成熟,其中最為著名的就是文獻計量學中的共現研究,而針對內涵更豐富的異質性知識關聯網絡則相對較少,已有的研究多集中在耦合分析領域,由于其結構的特殊性,在分析方法上還有待完善。
實際上,同質性知識關聯網絡本質上可以看成是異質性知識關聯網絡在受約束條件下的特例。[7]以表3為例,可以看成是表2在約束條件,即{Ti}與{Ej}之間存在相關性。這一結果對于解決企業知識服務的針對性和前瞻性具有重要的價值和意義。
二、企業知識需求的表征
關于什么是知識需求(knowledge demand),目前學界尚未有清晰、統一的界定,但我們可以將其看成是“一個受到內、外部環境的共同影響、動態演化的隨機過程”[8],對其進行定量描述是非常困難的。本文認為,可以間接以一種替代形式來表征和描述知識需求,其基本的思路如下:任何一個知識主體(包含企業)的活動必然會外化為某種可以觀測、記錄和獲取的物質形式(語言、文字、數字或圖表),這些形式可以將其歸類為不同的知識單元,進而構成相應的知識關聯網絡;那么,對于企業知識需求的研究就可以簡化為對與企業相關的知識關聯網絡及其結構的研究。例如,以表2為例,{Ej}表示企業的集合,{Ti}表示知識單元的集合,那么aji就表示與企業Ej與知識單元Ti的相關系數,系數越大說明其相關性也就越緊密。
這樣的表示雖簡單,但其僅能夠提供當前某個企業可能的知識需求,因而并未解決更加重要的需求趨勢預測問題。這時候就需要綜合盡可能多的相似企業知識需求信息,以期找到某些規律和結構特征,具體的做法是:在表2的基礎上建立表3,并對其進行聚類分析,然后根據相關知識單元所在聚類反推以確定特定企業可能的知識需求及其變化。如圖1所示,Ei表示不同的企業,ti為不同企業所對應的知識單元,C為對同質性知識關聯的聚類。以E1為例,t1為其直接知識需求,而{t2,…,ti}則為其潛在的知識需求;同時,從結構上看,潛在知識需求中的不同知識單元與E1之間的關聯程度是不同的,以此就可以表征出語義更加豐富企業知識需求內容與結構。
三、基于語義關聯網絡的企業知識需求識別方法
基于語義關聯網絡的企業知識需求識別方法主要涉及到主題詞表的編制、關聯信息的搜集與提取、共現關系網絡的生成、聚類與關聯規則對應等步驟。具體包括:
1.主題詞表的編制。用來指代細粒度的知識單元,主要在確立樣本企業后,通過多方面、多渠道的搜集來編制,并經過不斷的學習和優化來提高主題詞表的代表性和科學性;
2.關聯信息的搜集與提取。由于考慮到目前網絡信息資源已經成為企業信息的主要呈現形式,因此主要通過網絡爬蟲等手段獲取與不同企業相關聯的關鍵詞;并通過主題詞表條目的逐一對比,構建表2所示的異質性知識關聯網絡;
3.共現網絡的生成與聚類。將得到的異質性知識關聯網絡轉化為表3所示的同質性知識關聯網絡,以備后續的知識單元聚類分析(其結果如圖1所示)。
4.關聯信息的對應。將得到的分析結果通過表2進行關聯信息的對應,最終確定不同企業的知識需求內容與結構。
四、實驗與討論
1.實驗。為了驗證方法的有效性,本文利用上述方法對福建省晉江市的20家企業的只是需求進行了識別。數據來源主要通過企業官方網站和百度搜索獲取,并利用《福建省產業主題詞表》作為參照對獲取的關鍵詞信息進行了修正、優化,最后利用聚類與對應后的分析結果(當前知識需求和未來知識需求目錄)對20家企業進行了問卷調查來判斷分析結果的準確性。問卷采用李克特量表(Likert scale),企業分別對與自己相關分析結果中的主題詞按“非常準確”(得分1)、“準確”(得分0.5)、“不一定”(0)、“不準確”(-0.5)、“非常不準確”(-1)一一打分,最后計算得分的平均值,調查結果參見表4。
2.討論。從表4來看,實驗結果具有一定的準確性,對知識需求判定和知識需求預測的平均準確度分別達到43.3%和47.9%,但整體上的準確度還有很大的提升空間。通過研究,本文發現實驗結果的準確度主要受到三個方面的影響:一是信息獲取的全面性和準確性高低;二是參照主題詞表的科學性和完整性;三是受訪企業對知識需求的認知和表述能力。前兩個因素屬于方法本身所存在的系統性問題,需要通過后續的深入研究來不斷減小誤差,但由于受到當前相關條件的限制,這類誤差只能盡量減小克服但無法消除;第三個影響因素則屬于方法的外部性干擾問題,即企業是否具有能力去理解和表述自身的知識需求,這需要企業具有或者可以找到具備知識管理相關知識背景的專業人員,而在本文實驗中的20家企業大多不具備這樣的條件。
五、結語
新常態下,產業經濟的創新與發展有賴于強化企業作為創新主體的根本性作用,其中的關鍵就是如何提高企業的知識創新能力。就政策而言,知識產品具有典型的公共產品屬性,其投入產出的不平衡使得廣大中小企業自身既沒有動力也沒有能力去投入生產,而只能退而求其次尋求外部公共資源的支撐。因此,各級政府作為創新驅動戰略的實施者和領導者應該在知識產品生產與服務上加大投入力度,同時加強和鼓勵面向企業和產業創新的知識服務制度建設。本文基于知識關聯網絡的企業知識需求識別方法實際上就是面向產業經濟創新的公共知識服務平臺建設這一大背景所提出來的,其目的就是針對企業實際探尋產業驅動的知識服務新方式。
參考文獻:
[1]孫萬東,趙建梅.知識鏈與企業核心競爭力[J].山東社會科學,2007(7):118-120.
[2]陳建軍,袁凱.從經濟關聯走向知識關聯——產業空間分布動力機制演化[J].南開學報(哲學社會科學版),2013(5):88-96.
[3]文庭孝,劉曉英,劉進軍.知識關聯的理論基礎研究[J].圖書館,2010(4):9-11.
[4]Hipp J, Ntzer U, Nakhaeizadeh G. Algorithms for association rule mining -a general survey and comparison[J]. Acm Sigkdd Explorations Newsletter, 2000, 2(1):58-64.
[5]Vaidya J. Privacy preserving association rule mining in vertically partitioned data[J]. Journal of Computer Applications, 2006, 26(1):639--644.
[6]Qian G, Rao C R, Sun X, et al. Boosting association rule mining in large datasets via Gibbs sampling.[J]. Proceedings of the National Academy of Sciences, 2016, 113(18):201604553.
[7]康宇航.基于融合創新視角的異質性知識流動網絡探測研究[J].情報學報,2016,35(9):963-970.
[8]Pier Paolo Patrucco. Collective knowledge production costs and the dynamics of technological systems[J]. Cardiovascular Diabetology, 2005, 18(3):295-310.
基金項目:福建省軟科學研究項目“面向福建省縣域經濟創新的知識服務平臺及其利用研究”(2015R0054)。