劉恩澤 譚欣杰



摘 ?要:該文創新性地應用文獻計量方法、專利分析法及內容分析法對軟件項目領域的期刊文獻及專利文獻進行分析,首先從數量趨勢及內容趨勢研究軟件項目管理整體的發展趨勢及研究熱點的演進,得出2010年后期刊文獻、專利文獻量開始向相反的趨勢發展。針對此問題,從期刊分布、期刊作者合作網絡圖譜及IPC分布情況,具體分析2010年后軟件項目管理的發展現狀。
關鍵詞:文獻計量 ?專利分析 ?軟件項目管理
中圖分類號:C931.3 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?文獻標識碼:A ? ? ? ? ? ? ? ? ? ? ? ? 文章編號:1672-3791(2019)06(a)-0253-04
自20世紀70年代中期以來,軟件項目管理受到人們廣泛關注,軟件項目管理和軟件開發技術一同被視為消除“軟件危機”的對策。相較于其他有相對完整項目管理理論的行業領域來說,軟件項目管理理論發展與實踐尚處于摸索發展的階段。而文本挖掘技術已經被應用在項目管理中的多個領域,但國內多集中于項目管理的風險管理及決策管理研究等領域,對于軟件項目管理領域,尚未有學者做相關的研究。基于此,為探索中國軟件項目的發展現狀,該文將結合文本挖掘技術,應用文獻計量方法結合專利分析法,分析基于中國知網的期刊文獻及基于佰騰專利數據庫的專利文獻。
1 ?研究方法及數據來源
該文選取中國知網(CNKI)期刊文獻檢索系統,以“數據質量優先,兼顧檢索效率”為檢索原則,制定以”軟件項目”為關鍵詞、檢索時間為1992—2017年、檢索表達式為=“軟件項目”or“軟件項目管理”、期刊類型為核心、中國為檢索區域的策略檢索軟件項目的期刊論文數據,經優化檢索策略后再次檢索,所得文獻量為215條。另外,該文選取佰騰專利數據庫(BAITEN)檢索系統,以同樣的原則和策略進行了檢索,所得專利文獻量為136條。
該文將利用檢索所得的215期刊文獻及136條專利文獻,進行文本挖掘、文本計量及專利分析,首先以軟件項目文獻量及文獻著錄項內容為對象分別做數量的發展趨勢分析以判斷目前軟件項目所處的發展階段,然后以2010-2017年文獻為研究對象,應用內容分析法結合專利分析法從期刊文獻的期刊分布情況分析近年的科研主題聚集情況、從期刊文獻的作者合作情況分析近年研究領域的學者分布情況,從專利文獻的法律狀態及地域IPC分布分析各地區軟件項目領域技術創新水平。
2 ?現狀分析
2.1 發展階段分析
以所得期刊文獻及專利文獻為基礎,按照年度繪制年份—總文獻量(總文獻量=期刊文獻量+專利文獻量)、年份—期刊文獻量、年份—專利文獻量3條統計曲線,并在圖1中顯示。由圖1可知,總文獻量曲線于1992—2007整體上以較為迅速的速度穩步上升,于2007—2015年波動下降,于2016年迅猛增長。究其原因可知,2016年,5G概念的提出,有助于智能終端的高級功能的研發及拓展,間接地刺激了中國整體上對于軟件項目的研究。
期刊文獻數量的多少可一定程度上代表研究對象的學術研究成果的發展水平,從期刊文獻角度上看,可應用Logistic生長曲線模型對其進行分析,經過計算可得其生長曲線方程為:
并應用/計算其擬合優度,其中,Oi為第i個時間的實際值,Ei為第i個時間的預測值。經計算,可得,,自由度=n-1,n=23,所以可以用上述S曲線方程對期刊文獻的生長過程進行分析與預測。由此可計算出,兩個速度拐點分別為t1=9.900537,t2=15.55788,高峰點為t=12.72921,本文中t0=1992,根據以上數據可分析出,我國關于軟件項目的學術研究,于2003(t1)年進入始盛期,于2007(t)年達到高峰值,于2010(t2)年進入盛末期,且相對于研究區間來說幾個拐點之間距離較小,說明中國軟件項目學術研究的課題重點變化較為頻繁。
而與期刊文獻相對應,專利文獻的年度發表量即專利申請量/授權量在一定程度上可代表該地區的技術創新水平,從專利文獻角度看,1992—2005年,我國關于軟件項目的研究處于空白期,大幅度落后于同時期的歐美國家,2005年我國開始出現對軟件項目的專利申請,經過2年的緩沖期與學習期,中國軟件項目于2007年進入快速發展階段,至今仍然維持著這一發展態勢,這一現象說明,中國軟件項目市場發展繁榮,國家也較為重視軟件項目領域的技術發展及技術創新。其間于2010—2015年處于波動發展階段,整體上并未呈現明顯的上升發展趨勢,這一現象說明2010—2015年期間,軟件項目研究熱點有所改變。
綜合文獻量、期刊文獻量及專利文獻量來看,專利文獻量發展趨勢更貼近總文獻量的發展趨勢,且近年專利文獻量處于上升的發展態勢,反之,期刊文獻量處于下降的發展態勢。結合上述關于期刊文獻和專利文獻的發展趨勢分析,2010年期刊文獻研究進入盛末期后,學術成果向市場的轉化經歷了與中國市場一段時間的磨合后,能夠轉化為企業的核心能力及核心資源,同時從一定程度上說明,期刊文獻的研究成果已經轉化為專利技術成果應用。
2.2 研究熱點及演進分析——詞云
基于期刊文獻著錄項的關鍵詞項,以年份為橫軸做熱點演進趨勢圖如圖2,圖中節點大小表示對應關鍵詞出現的頻數,顯示閾值設置為4。由圖明顯呈現為3個階段:1993—1999年、2000—2010年、2011—2017年,該階段劃分符合圖1中期刊文獻量曲線的走向。第一階段集中于學習/遺忘特性的軟件項目調度多目標優化方法的研究,第二階段集中于CMMI應用,基于貝葉斯算法、神經網絡、遺傳算法等的風險評估、風險管理、風險控制、風險分析等。2010年后,演進趨勢不甚明顯,初步可判定集中于軟件項目風險管理及工作量的估計、CMMI運用。為探究2010年后研究熱點的演進,調整閾值為2,結合對文獻中題目項的分析,可知:2010年后研究熱點集中于風險儲備時間、重大偏差標準、系統風險管理、進度控制、案例研究、開源等詞。基于此可做具體分析如下。
(1)初期,國內對于軟件項目管理的研究尚處于起步階段,沒有相對成熟的理論研究,因此國內對于軟件項目的研究多借鑒其他知識領域的理論。
(2)項目管理同時出現第二階段、第三階段,說明經歷一段時間的研究后,相對于第二階段,第三階段中的項目管理已然出現了新的方向。
(3)2010年后,研究熱點轉向新的領域,因而2010年后的期刊文獻量按照下降的趨勢發展(見圖1)。
綜上,2010年成為軟件項目領域研究熱點的轉折年,為探索2010年后中國軟件項目的具體發展現狀,該文將從期刊分布、作者合作網絡情況及專利IPC分類分布角度進行具體分析,從而得出近年來軟件項目的文獻研究熱點、專利研究熱點、科研人員合作情況及研究領域等方面的發展現狀。
2.3 期刊研究熱點分布及作者合作情況分析
通過對2010—2017年后期刊文獻的期刊來源、題目及摘要項內容的分析,可以得出如下結論。
(1)整體上,可將發表所屬主題分為理論應用實踐、理論研究和發展兩個方向,其中理論應用實踐方向發文數為8篇,理論研究和發展發文數為53篇。理論研究發文數遠遠多于應用實踐方向。
(2)在理論應用及實踐方向,通過文本聚類,可分為兩個主題大類:CMMI應用及課程項目化教學的軟件協作。CMMI應用大類下,發文4篇,可細分為網絡學習空間軟件項目、機載雷達軟件項目及工業質譜儀項目;在課程項目化教學大類下,發文4篇,可分為數學、會計、軟件項目綜合實踐課程的項目化教學。
在理論研究及發展方向,通過文本聚類,可分為軟件項目風險、工作量、項目進度、需求分析、成本、績效評估、項目管理及軟件開發大類。通過文本挖掘,可細分小類及對應的發文數情況,列示如表1所示。
該文將文獻數量定義為衡量理論研究及發展熱點方向聚集程度的標準,且定義文獻量>4的研究領域定義為熱門研究領域。據表可明顯得出,目前在理論研究及發展方向,研究熱點主要聚集于軟件項目風險管理、軟件項目管理、軟件工作量、軟件項目進度管理領域。文獻量最多,即熱點聚集度最高的為軟件項目風險管理領域,在此方向又聚集于軟件項目的風險評估及風險管理方法研究;次之為軟件項目管理領域,在此方向熱點聚集于軟件項目管理的方法、質量管理、資源分配、知識管理、成員管理等方向;其后為軟件項目進度管理的研究,集中于項目進度估計、監督與控制等方向;最后為軟件項目工作量的研究,集中于軟件項目工作量估計及生產效率方面的研究。
為探討上述熱點研究領域的學者分布及合作情況,通過應用BICOMB2、Ucinet及Netdraw軟件,可繪制作者合作網絡圖譜(見圖3),節點大小表示發文數量,連線粗細表示合作強度。圖譜顯示,在此領域共有6個合作團隊,通過對期刊文獻著錄項的作者項,結合題名及摘要項進行分析,可得出各團體的研究方向及成員間的合作情況。
以胡勇為中心的合作團體的研究方向為軟件項目風險預測及決策;以張俊光等人為核心的合作團隊的研究方向為軟件項目工作量估計及管理辦法,軟件項目進度估計、控制及監督方法及軟件項目風險管理方法;以鄒艷珍等人為核心的合作團隊的研究方向為軟件知識圖譜的應用;以于本海為核心的團隊的研究方向為軟件項目成本估算,軟件項目績效評價及軟件項目知識管理;以楊莉為核心的合作團隊的研究方向為軟件項目風險管理、排序、評估及關鍵鏈管理;以劉宇為核心的合作團隊的研究方向為課程教育軟件協作。
2.4 專利IPC分布情況分析
基于IPC分類代表含義與軟件項目領域知識的結合,概括該文中各小類IPC分類號所代表含義如下。
G06F:數據轉化及傳輸的程序控制裝置以及數據的錯誤檢測及校正,應用于軟件項目開發、軟件項目管理、軟件項目測試階段(集中于需求測試變更、缺陷測試),多采用模塊化、全生命周期管理等方法,實現個性化或提高效率、降低成本的目的。軟件開發集中于需求變更,用戶界面設計等。
G06Q:專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法,應用于軟件項目管理,軟件項目開發及軟件項目進度管理領域。多采用蟻群算法、仿真模型實現軟件項目設計目的。
G01R:電性能的測試裝置;電故障的探測裝置;以所進行的測試在其他位置未提供為特征的電測試裝置。多應用于軟件開發過程。
G06K:用于閱讀或識別印刷或書寫字符或者用于識別圖形的裝置,應用于軟件項目管理及軟件人力資源管理領域。
G06N:基于生物學模型的計算機系統,多應用于軟件項目管理領域下的工時估算。
H04L:數字信息的傳輸——數據交換網絡,多應用于軟件項目開發過程中的性能監控、資源部署及軟件項目管理領域
H04W:無線通信網絡——網絡數據管理及測試、監督裝置,多應用于軟件項目管理中的進度監控過程。
基于檢索所得專利文獻繪制IPC比例圖(見圖4)。由圖可知,G06F占總比67%,G06Q占總比25%,H04L、H04W均占總比2%,G01R、G09B、G06N、G06K均占總比1%。G06F、G06Q占據所有專利數的92%,說明目前中國市場上,軟件項目管理知識轉化的方向集中于軟件項目開發、軟件項目管理、軟件項目進度管理等領域,應用于軟件項目的需求變更測試、缺陷預測及檢測、數據模塊化處理、軟件項目進度監督及管理等過程,目的在于提高效率、降低成本或者滿足軟件用戶的個性化需求。
3 ?結論
綜合上述以軟件項目為研究對象的文本挖掘及專利分析所得結果,可得出如下結論。
(1)從整體數量上來看,文獻量經歷波折期后,目前呈現較快的上升趨勢,期刊文獻量多于專利文獻量,說明整體上,中國軟件項目領域學術研究強度仍高于技術研究強度。但自2010年后,專利文獻量開始超過期刊文獻發表量,而期刊文獻的發表主題集中于高校科研人員,專利文獻的發表集中于企業的研發人員,基于此可得出,中國軟件項目研究重點已經從學術研究轉向市場研究。通過對2010年后期刊在各主題的分布情況,結合整體內容趨勢中2010年后的研究熱點內容,即風險儲備時間、重大偏差標準、系統風險管理、進度控制、案例研究、開源,可認為軟件項目風險管理是整個軟件項目管理的重點,近年軟件項目進度成為新興研究熱點。
(2)對比近年來期刊文獻的主題分布及專利文獻的IPC分布情況,并通過文本挖掘將IPC分類對應軟件項目管理領域發展方向,可得出,期刊主題分布現狀符合通過citespace繪制的熱點趨勢演進圖,研究熱點以軟件項目管理風險、軟件項目工作量、項目進度等為主;不完全符合于期刊文獻,專利文獻所反應出的研究熱點為軟件項目的需求變更測試、缺陷預測及檢測、數據模塊化處理、軟件項目進度監督及管理等過程。
(3)總體上,通過對近年來期刊文獻主題分布以及學者合作團隊研究領域的分析,可認為目前中國軟件項目集中于軟件項目風險評估及管理、軟件管理等方向,而在軟件項目的需求、成本、績效管理領域研究較為欠缺,由此可為業內學者的研究提供借鑒。而專利文獻所反映的發展現狀正好彌補了這一現象,說明市場已經先于學術研究敏感地感知到了軟件項目管理領域的發展方向,市場中的企業作為專利的申請者及權利人,其研究成果可為學術研究提供一定程度的借鑒。
參考文獻
[1] 芮斌.信息化背景下軟件開發項目管理[J].電子技術與軟件工程,2019(5):42.
[2] 陳江濤.對基于信息化的軟件開發項目管理分析[J].電子技術與軟件工程,2019(3):37.
[3] 劉靜,康立飛,劉歆一.軟件開發項目管理的關鍵因素探討[J].中小企業管理與科技,2018(12):28-29.
[4] 蔡泉.軟件項目管理中的風險分析與管理[J].現代營銷,2018(12):108-109.
[5] 王前,劉通.軟件項目管理教學中的沙盤應用研究[J].才智,2018(31):34,36.