黃思佳 何翀 徐惠珍
摘要:本文選取2016-2018年CNKI相關文獻,運用文獻題錄信息統計分析工具SATI、可視化網絡分析軟件Gephi對“R&D投入與公司成長性”的研究情況從發文年度、發文機構單位分布、作者合著網絡、關鍵詞共現網絡、行業研究情況等方面進行分析,從而指出研究熱點與最新研究趨勢。
關鍵詞:R&D投入;公司成長性;Gephi;可視化
引言
在倡導實現“中國制造”到“中國智造”轉型的當下,我國大批企業著力更新科技水平,打造核心競爭優勢,以此創造新的利潤增長點。R&D投入作為影響創新能力的重要因素,因其極大的風險性質,一直是備受學者們關注的課題。因此,該投入對企業成長性的研究一直備受關注。
不同于形勢單一、呈現信息抽象的傳統數據可視化,可視化知識圖譜Gephi是一款交互式的復雜網絡分析軟件,能生動地展現出各要素之間的聯系和研究熱點。
本文采用文獻題錄分析工具SATI,借助Gephi的可視化網絡技術輔以excel匯總,描繪出2016-2018年R&D投入與公司成長性研究的圖譜,分析得出該課題的最新熱點、研究機構分布及行業研究情況。
1、數據收集與研究方法
1.1 數據收集
本文數據來源于中國知網(CNKI)論文數據庫中的文獻。在中國知網上以“R&D投入OR公司成長性”為搜索范圍,檢索日期截至2018年10月4日,最終得到316篇期刊和論文。
1.2 研究方法
首先對文獻題錄信息剔除同義詞,其次將文件導入SATI生成共現矩陣。對于發文年度、發文機構單位、行業研究情況等在excel中統計;對于關鍵詞共現矩陣與作者和主網絡,則選擇用Gephi將被研究頻數較高的詞條凸顯出來。同時,對邊進行過濾,將較熱門的研究方向顯現出來。最后,通過軟件統計的平均度、平均路徑長度、平均聚類系數等數值進行分析。
2、數據分析
2.1 發表年度分布
剔除年度相關文章中重復或不相關的記錄后,匯總發現可以將此課題研究劃分為:起步階段(1997-2004年)、發展階段(2005-2012年)、高潮階段(2013-2015年)和漸趨成熟階段(2016-至今)。在2012年度發文量大幅上升后,2013年相關發文數量達到最高峰169篇。2016年開始逐漸回落,另一方面也向我們傳遞著研究漸趨成熟的信號。
2.2 發文單位機構分布
發文機構可以分為五類:高校單獨發文、社會機構單位單獨發文、高校間聯合發文、機構單位聯合發文以及高校與機構聯合發文。匯總發現,316篇文獻中,290篇來自高校單獨發文,占比高達91.7%。高校聯合發文15篇,占比4.75%。總體而言,各大高校是最主要的貢獻力量。
截取SATI頻數統計前16位的高校,綜合類大學占16所總量的29.11%,6所財經類高校發文總量占比37.97%,理工類大學發文量占16所總量的45.57% 。由此得出結論,該課題更受理工類大學學生的歡迎。
2.3 作者合著網絡
用SATI截取文獻作者信息矩陣導入Gephi,共得到100節點、115邊。采用Fruchterman Reingold布局。其次,對節點進行排序并進行模塊化分割,統計發現88個社區,同時得到模塊化度量值0.753,表明合作團體間聯系較密切。
研究圖譜發現,發文作者分布較零散,多為碩博論文或單獨發表的期刊文章,僅存在6個合作較為密切的社區(社區之間不存在合作關系):唐瑋(唐瑋、曹蕾、崔也光)團隊、吳祖光團隊(吳祖光、康華、扈文秀)、張金鎖(張金鎖、呂靖燁、王婷、李明、李玲)團隊、龔詩婕團隊(龔詩婕、呂慶華)、任敏團隊(任敏、谷文林、林寧)、郭浩團隊(徐艷、郭浩)。其中,合著最為密切的是唐瑋-曹蕾-崔也光團隊,吳祖光團隊中吳祖光與扈文秀合著次數較多,而兩人與康華的合作較少。所有節點中度和加權度最大的是吳祖光和扈文秀,節點度為4,加權度為5.33,表明他們分別與四個作者有過5次的合作[1]。
2.4 關鍵詞共現網絡
將共現矩陣導入Gephi,共計導入100節點、962條邊。為防止節點存在重疊,最終采用ForceAtlas2的算法[2]。其次,設置節點波動范圍和標記顏色。統計頻數越大,節點也就越大,顏色也隨之加深。為區分大部分詞條的熱度,采用節點的模塊化分割形成11個社區。
節點加權度是指該節點與其他節點連接邊的權值的總和[3],即該詞條與相關聯的詞條共同出現的次數。經計算,關鍵詞共現網絡的平均度為10.62,平均加權度為1.305。因此,“R&D投入與公司成長性”的詞條關聯范圍較大,但關聯程度不夠密切。圖譜的平均路徑長度為1.996,網絡直徑為3,呈現小世界性[4]。圖譜平均聚類系數為0.745,該數值較接近1,表明節點之間的關聯較緊密。
由于圖譜中的邊交錯復雜,難以進行深入研究,因此進行邊的過濾,保留322條邊。(見圖2)經觀察計數發現,研究R&D投入與公司成長性關系的文章僅有7篇,而單獨研究R&D投入或者公司成長性的較多。其中涉及“R&D投入-企業績效”的高達50篇,涉及“R&D投入-融資約束”的有18篇,有關“R&D投入-股權結構-股權激勵”的有19篇。公司治理、創新績效、稅收優惠、政府補貼等詞條與R&D投入關聯也較緊密。除此之外,“公司成長性-創業板”(23篇)、“公司成長性-影響因素”(11篇)、“公司成長性-因子分析”(9篇)、“公司成長性-資本結構”(5篇)也是最近三年研究中的熱點問題。
2.5 行業研究情況
在圖譜顯示的節點中有部分“高新技術上市公司”、“環保類上市公司”、“農業上市公司”等行業詞條。為了進一步研究行業實例研究的情況,篩選出關鍵詞頻數統計中行業詞條的記錄,統計發現共有70篇行業實例研究文獻,占文獻總數的22.15%。這表明“R&D與公司成長性”課題的相關實例研究較少,偏向理論研究的較多。70篇實例研究中有關高新技術產業的實例研究有13篇,占行業研究總數的18.75%。設備制造業、生物醫藥、農業緊跟其后,分別占有14.29%、11.43%、8.57%。
3、結論與不足
3.1 研究結論
一是,在2013-2015年的研究熱潮過后,最近三年的年度發文數量逐漸減少,研究趨向于成熟。2016-2018年R&D與公司成長性研究中,社會機構單位的發文數量占極小部分,各類高校則是探究主力軍。其中,理工類大學的相關貢獻較多,財經類高校次之。
二是,作者合著網絡較為分散,少有關聯緊密的合著團隊。而在關鍵詞共現網絡中,單獨研究R&D投入、公司成長性的文獻居多。其中,R&D研究延伸范圍較廣,涉及企業績效、融資、股權結構、高管激勵、稅收優惠等方面的文獻數較多。而公司成長性涉及的研究課題較少,影響因素、資本結構等為熱點方向。
三是,該課題下的理論研究較多,實例研究僅占70篇,其中高新技術產業、設備制造業、生物醫藥、農業等領域的相關研究居多。而創業板上市公司因其高成長性,成為研究成長性的典型。綜合以上論述,建議增加對創業板上市公司R&D投入與公司成長性的實例研究。
3.2 研究不足
首先,在對題錄關鍵詞進行同義詞清洗前需要人工識別,可能存在個別同義詞被忽略的情況,形成一定誤差。其次,在使用文獻題錄信息統計工具SATI生成關鍵詞共現矩陣時,由于軟件出于實際意義的限制,只能導出前100條記錄,遺漏了少部分信息。
參考文獻
[1] 彭琰,嚴莉.基于Gephi的云南民族醫藥研究可視化分析[J].醫學信息學雜志,2015,36(02):65-68+89.
[2] 王揚,田野,李鐵山,陳俊龍,彭東成,周義華.基于Gephi的航運招聘信息可視化分析[J].大數據,2018,4(03):81-91.
[3] 曹霞,崔雷.合著網絡評價指標與文獻計量學評價指標相關性研究[J].中華醫學圖書情報雜志,2016,25(2):20-26,74.
[4] 張梅,翁志輝,楊振,林海清,黃愛萍,劉健宏.我國水土保持學科領域作者合著網絡分析[J].中國水土保持, 2017(12):47-49.
[5] 劉勇,杜一.網絡數據可視化與分析利器: Gephi中文教程[M].北京:電子工業出版社,2017:163-164.
[6] 王龍.合作網絡模型結構研究與應用[D].濟南:山東師范大學,2015:19-21.
作者單位:江蘇大學財經學院。