梁啟冰
(山東省日照第一中學 山東日照 276800 )
?
山東省軟件和信息服務業發展驅動模式的共詞可視化分析
梁啟冰
(山東省日照第一中學 山東日照 276800 )
摘 要:分析有關山東省軟件和信息服務業發展的“十二五”規劃文件,用修正的中文文本關鍵詞提取算法和Bicomb軟件提取并確定高頻關鍵詞,建立關鍵詞共現矩陣;用SPSS17.0進行因子分析和聚類分析,將山東省軟件和信息服務業發展“十二五”規劃的核心主題劃分為四個類團:基礎要素、融合創新、發展環境、規劃布局;通過繪制戰略坐標圖并對各類團進行詳細的分析解讀,最后把山東省軟件和信息服務業發展定位為基礎要素、發展環境拉動為主,融合創新、規劃布局推動為輔的驅動模式。
關鍵詞:軟件與信息服務業 發展模式 共詞分析 “十二五”規劃
隨著信息技術、通訊技術的飛速發展以及互聯網技術的廣泛應用,軟件和信息技術服務業逐漸成為發展速度最快、技術創新最活躍、增值效益較大的產業門類[1],其所帶來的社會和經濟效益令世人矚目。山東省作為全國工業經濟大省和信息產業重要基地,軟件和信息服務業在過去的幾年里快速崛起并保持較快增長態勢,其應用領域不斷擴展,產業結構逐步優化。在此背景下,挖掘山東省軟件與信息服務業發展現狀,探索其發展驅動模式,對山東省軟件與信息服務業產業規模的擴大增長、產業結構的轉型升級,乃至經濟效益的提高等都具有極其重要的現實意義。
目前關于軟件和信息服務業或信息服務的研究文獻已很多,但從產業發展驅動模式的角度來研究的文獻相對較少,而在少有的研究中對軟件與信息服務業發展現狀的研究或是基于地方統計年鑒的具體數據,利用DEA方法來分析[2];或是通過模糊綜合評價法、灰度關聯評價法、主成份分析法等進行評價研究[3];或是通過構建模型,借助仿真過程對未來發展進行預測[4]。上述研究方法均以具體數據為依據,通過合理的數學方法導出結果,方法已近完善和成熟。本文嘗試從一個新的視角,通過可視化的方法來呈現山東省軟件與信息服務業的發展現狀和發展重點,探索其發展驅動模式,期望能夠拓展可視化方法的研究范圍,為產業發展研究提供新的研究思路,為軟件和信息服務業制訂產業規劃、出臺產業政策提供有益的參考。
1.材料來源
“十二五”發展規劃是當前和今后一段時期內地區經濟社會發展的政策性綱領,其中的關鍵詞反映了綱領文件的主題和精髓,是解讀各級政府文件精神、探析主題發展規律和發展態勢的重要依據[5]。本文研究的原材料包括:山東省國民經濟和社會信息化“十二五”發展規劃[6]、山東省軟件和信息服務業“十二五”發展規劃[7]、山東省國民經濟和社會發展第十二個五年規劃綱要[8]等。
2.研究方法及研究工具
本文采用的分析方法是文獻計量學中的共詞分析法。共詞分析法是文獻研究的重要方法之一,是利用文獻集中關鍵詞共同出現的情況,來確定文獻所代表學科中各主題之間的關系。詞匯對在同一篇文獻中出現的次數越多,說明這兩個主題的關系越緊密。共詞分析法就是將文獻關鍵詞作為分析對象,利用層次聚類、戰略坐標、社會網絡分析等多種統計分析的方法,把眾多分析對象之間隱含的復雜關系以可視化的方式直觀地表現出來。共詞分析采用的研究工具包括兩類,一類是詞頻統計、矩陣生成軟件,如Bicomb、BibExcel、CnkiRef等;一類是可視化分析軟件,如Spss、Pajek、UCINET、Citespace、HistCite等。本文采用的研究工具是:ICTCLAS分詞系統、中文文本關鍵詞“詞跨度”提取算法[9]、中國醫科大學崔雷博士開發的Bicomb書目共現分析系統和統計學分析軟件Spss17.0。
影響產業發展的動力因素概括起來有以下幾點:
1.政策制度。政策和制度體現在知識產權保護、建立人才引進激勵機制、建立風險投資機制、建立技術成果轉讓機制、加強市場環境建設、加大稅收政策優惠力度、制訂和執行嚴格的技術和產品、制訂安全和環境標準、指引產業集群的形成和發展規模等方面,好的政策和制度對產業發展起到正確引導、推動產業快速、均衡發展的作用。
2.基礎設施。信息化基礎設施是軟件與信息服務業賴以生存發展的物質基礎,包括基礎網絡、系統架構、業務平臺等。基礎設施的條件直接反應了地區的信息服務能力和水平,直接影響著企業在當地投資、生產、經營的成本,制約著區域產業發展的規模和層次[10]。
3.人力資源。人力資源是指一定時期內組織中的人所擁有的能夠被企業所用、且對價值創造起貢獻作用的教育、能力、技能、經驗、體力等的總稱[11],包括從業人員數量、人才培養、人才引進、人力成本等多個方面。軟件和信息服務業屬于第三產業,其發展的方方面面對人力資源都有著相當的依賴,特別是在技術創新方面,更是有賴于高端技術人才。
4.投資融資。軟件和信息服務業發展中對資本有較高的需求,在技術開發、公共技術服務平臺建設、基地園區建設、品牌建設、重大項目建設、高層次人才隊伍建設、風險投融資、海外市場開拓、知識產權保護的資金投入等方面均需要資金支持,通過多種途徑,建立多元化、多層次的投融資體系,對軟件和信息服務業的發展壯大具有全局的意義。
5.技術創新。技術創新就是利用一種全新的生產或商業模式,將生產要素、生產方式和經營模式以新的方式進行組合,促進新興領域和高端業務的發展[11]。就軟件和信息服務業而言,技術創新促進新平臺、新技術、新產品、新模式不斷涌現,產品市場不斷拓展與深化,產品市場競爭力不斷提高,產業結構順利實現轉型升級。可以說技術創新是推動軟件和信息服務業發展的不竭動力。
6.結構布局。產業結構主要是指一個產業內部的企業規模、企業數量、產業集中度、企業競爭情況等;產業布局是根據區域優勢特點,規劃產業的空間分布和組合,使各種資源、各生產要素在空間地域上實現良性配置。合理的產業結構和產業布局能夠在分工基礎上形成特色優勢和創新優勢,形成規模效應和品牌龍頭企業,提升產業競爭力。
各動力因素的合力直接決定產業發展的規模、層次和速度,決定產業的發展模式。本文對來源材料關鍵詞的提取、對山東省軟件和信息服務業發展驅動模式的分析都是以影響產業發展的動力因素為依據的。
根據“十二五”發展規劃的層次結構,通過ICTCLAS系統對“規劃”文件逐層進行分詞。修正謝晉[9]的“詞跨度中文文本關鍵詞提取”算法,把算法中的“位置因子”改為“動力因素因子”,并賦予較高的權值;根據研究主題和影響產業發展的各動力因素,對經過分詞處理后的來源材料按層次結構提取關鍵詞;之后借助人工對提取的關鍵詞進行刪除、合并、去重操作。為了利用詞頻統計軟件Bicomb完成對關鍵詞的共現次數統計和獲取共現矩陣,將清洗后的關鍵詞按層次結構分次復制到由CNKI下載的任一.txt文本中的關鍵詞位置。通過Bicomb的再次統計,我們截取前25個高頻關鍵詞并生成共現矩陣。然后利用Spss17.0將共詞矩陣轉化為斯皮爾曼相關矩陣,如表1 所示(限于篇幅,只截取前12個關鍵詞),以消除由共詞頻次差異所帶來的影響,真正揭示關鍵詞之間的共現關系。在相關矩陣的基礎上,完成共詞可視化分析,具體包括因子分析、聚類分析、戰略坐標圖分析等。

表1 斯皮爾曼相關矩陣
1.因子分析
因子分析是利用降維方法進行統計分析的一種多元統計方法,該方法用較少的指標來代替和綜合反映原來較多的信息。其基本思想是根據關鍵詞間的相關性大小把研究對象的變量分組[12],每組變量代表一個基本結構,即公共因子,這樣就可以用較少的幾個公共因子解釋原資料的基本信息。本文利用Spss17.0降維分析中的因子分析,得到因子分析碎石圖,如圖1所示。取3個因子時,累積方差貢獻率為79.522%;取4個因子時,累積方差貢獻率為87.248%,取5個因子時,累積方差貢獻率為89.997%,所以將研究對象分為4類比較合理。

圖1 因子個數碎石圖
2.聚類分析及核心主題的確定
聚類分析是利用變量間不同程度的相似性,對事物進行分類,使同類內變量之間相似性較高,而不同類變量間相似性較低[12]。采用聚類分析法中的質心聚類法,根據因子分析的結果,我們將提取的25個關鍵詞劃分為四個類團。引用鐘偉金提出的粘合力的思想[13],來確定各類團的核心主題詞。粘合力可用來衡量類團內各主題詞對本類團的貢獻程度,一個類團中,粘合力最大的詞被看成本類的中心詞,表征本類團的核心概念。設某一類團有n個主題,其中主題A與類團內其他主題組成詞對,如果這些詞對同時出現頻率的總和為c,那么主題A的粘合力為根據粘合力計算公式,計算各類團中所有主題詞的粘合力,確定四個類團的中心主題分別為:規劃布局、發展環境、基礎要素、融合創新,如圖2所示。

圖2 山東省軟件和信息服務業關鍵詞聚類圖
3.戰略坐標圖
戰略坐標圖是在主題詞的共詞矩陣和聚類分析的基礎上,用可視化的形式來揭示各研究類團的結構及關聯強度[14]。它以向心度(Centrality)和密度(Density)為參數繪制成一個二維坐標,橫軸表示向心度,縱軸表示密度,原點是所有二維數對向心度、密度的平均值,向心度用來量度一個類團和其他類團相互影響的程度,向心度越大,即一個類團和其他類團之間聯系越緊密,則該類團在此研究主題中就越趨于中心位置;密度用來衡量各類團內部的關聯強度,它表示該類團維持自己和發展自己的能力[15]。根據各類團所在戰略坐標圖中的位置,可以直觀地描述各類團內部的聯系和不同類團之間的關聯、表現研究主題的結構、發展成熟度及發展趨勢。密度和向心度按下式計算。

其中,Eij是關鍵詞共現次數,n是某一類團中的關鍵詞的數目,N是共詞矩陣中所有關鍵詞的數目,Sf指一個類團,f指研究領域的整體[16]。
計算各類團的密度和向心度,結合因子分析和聚類分析的結果,繪制研究主題的戰略坐標圖,如圖3所示。

圖3 山東省軟件和信息服務業關鍵詞類團戰略坐標圖
圖3中,所有類團向心度和密度的平均值決定一點(12.85,2.723),作為坐標原點,它將整個戰略坐標圖分為四個象限。其中,“基礎要素”位于第一象限,具有遠高于其他類團的密度值和較高的向心度,說明該類團內部的關鍵詞聯系最為緊密,該類團與其他類團具有相對密切的關聯性,處于研究主題的中心,是領域發展的核心動力。“發展環境”類團在研究主題中具有最高的向心度,說明該類團與其它類團關聯最密切,在本研究中占有及其重要的地位;“發展環境”類團的密度值比“融合創新”、“規劃布局”兩類的密度值都高,說明類團內聯系相對密切,已具有潛在的發展空間,通過進一步地完善和協調,將成為山東省軟件與信息服務業未來發展的重要動力。“融合創新”、“規劃布局”兩類團處在第三象限,密度和向心度都不高。說明它們自身發展不夠成熟,與其他類團的關聯也不強,在研究主題中距離領域發展的核心動力還較遠,只能稱為山東省軟件和信息服務業發展的輔助動力。
1.基礎要素
軟件和信息服務業發展最基礎的要素包括基礎設施、人才資源、資金資源、系統平臺等。山東省“十二五”規劃強調基礎設施建設,在教育、醫療、物流、電信、金融、物業、交通、公安、政務、城管、安防、工商、銀行、質監、海關、商務、旅游、氣象、餐飲、家政、物業、娛樂以及生態保護等領域均建有完善的信息服務系統和管理系統,建成開通各類公共服務平臺,要求有條件的地區和機構建設新型云計算基礎設施;各種網絡如電信網、互聯網、廣播電視網等覆蓋面積逐步擴大,逐步實現城鄉之間的互聯互通。對信息資源的開發和利用已成為山東省信息化建設“十二五”規劃的核心工作,各信息化應用領域均建有基礎數據庫,重點領域具有豐富完善的信息資源數據庫,領域間基礎信息共享范圍不斷擴大,正逐步實現跨地區、跨部門的信息共享和業務協同。資金資源、人才資源是軟件和信息服務業發展的重要支撐和保證,山東省正逐步形成以政府投入為引導、企業投入為主體、其他投入如銀行金融機構投入、民間資本投入、國內外風險資本投入為補充的多元化、多渠道的信息化投融資機制;山東省高度重視人才資源在軟件和信息服務業發展中的作用,政府不斷加大高端人才的引進力度,重點引進軟件與和信息化發展中緊缺的各類高層次、高技能、創新性、復合型人才,構建起高等教育與職業教育相結合、公益培訓和商業培訓相補充的信息化人才培養體系,以高素質人才增強軟件與和信息服務業發展的智力支撐。
山東省軟件與和信息服務業人才建設、資金扶持目標明確,即為實現技術創新創建良好的產業發展環境;山東省完善的基礎設施、系統平臺不斷吸引其他地區的產業向本地區轉移,從而推動當地產業規模不斷擴大和產業聚集,形成有效的產業格局;科學合理的產業布局又會進一步擴大生產規模、提高生產效率、促進技術進步,提高產業的競爭力,于是進一步吸引資本、人才向本地產業集中。這樣的良性互動將驅使山東省軟件和信息服務業發展走上一條快速道。
2.發展環境
發展環境包括政策環境、科研環境、產業環境、合作交流環境、行業協會監管環境、市場環境等。其中政策環境對軟件和信息服務業的發展起主導作用,山東省十二五規劃制定了一系列適應軟件與信息服務業發展需求的產業政策、財稅政策、人才政策、投融資政策、原材料和產品進出口政策等。在政策引導的大環境下,十二五規劃對信息化發展環境具體作了如下的規劃和調整:(1)強化基礎環境。改造傳統產業服務平臺,建成開通農業綜合信息服務平臺、電子商務服務平臺、物流信息化公共服務平臺、移動信息化服務平臺等,為信息化順利實施創造良好基礎條件;推動“平安山東”建設,建立山東省共享災備服務平臺、云計算與物聯網安全平臺、互聯網內容監管系統,保障信息資源安全使用,營造安全有序的網絡環境。(2)構建科研環境。建立各類信息化支撐機構,發揮省經濟和信息化發展研究院、省兩化融合促進中心、省軟件評測中心、省信息化培訓辦公室、省數字證書認證管理等現有支撐機構的作用,依托國家級和省級企業技術中心、國家和省級企業重點實驗室、軟件工程技術中心等,通過人才培養與引進、對外合作與交流等途徑營造產學研用一體化的科研合作環境。(3)規劃布局環境。加強國家級省級產業基地、產業園、軟件園的發展環境建設;各軟件園在發揮自身優勢和特長的同時,加強與其他園區的交流和互動,促進不同園區間的優勢互補和資源整合,提升軟件和信息服務業的整體競爭力。(4)優化市場環境。鼓勵重點領域生產具有知識產權的知名軟件產品,增強產品出口能力,提高產品在國內國際兩大市場的占有率。建立行業管理體系,整頓和規范市場秩序,打擊各種違法侵權行為,充分發揮行業協會、產業聯盟等企業組織在市場調查、信息交流、知識產權保護、資質認定等方面的作用,加強行業自律,促進市場環境更加安全有序、開放透明。
在政府的積極規劃和適時調控下,十二五期間山東省軟件與信息服務業發展環境將得到進一步優化。但與我國軟件與信息服務業發展較快的一線城市相比、與山東省經濟大省的地位相比,發展環境建設還存在一定的制約因素和問題:政府支持和產業引導的力度還有待加強,在省外、尤其海外市場開拓方面仍存在不小的差距,還面臨著很多體制方面的障礙以及社會在轉型時期存在的很多信用缺失以及市場秩序混亂的狀態,合作交流仍顯不足。山東省需要克服困難、迎接挑戰,為軟件與信息服務業提供完善的發展環境,開創好良的發展局面。
3.融合創新
“融合創新”這一類團包括關鍵技術、自主創新、融合發展、工程項目、信息安全、轉型升級、以及產業發展的新模式、新業態等。總體來看,融合創新貫穿軟件和信息服務業發展的始終,融合與創新不僅體現在技術上,還體現在業務上、市場上。新技術的推廣和應用推動現有技術成果向實用化、市場化方向發展,加快了服務模式和產品的創新,從而推動產業向更深和更廣的方向發展;同時,較大的產業規模,功能完善、門類齊全的服務體系和產品會進一步吸引先進技術、資源和優秀人才的聚集,促進知識、技術外溢效益的產生,推動地區投入更多資源進行技術創新。
山東省信息化“十二五”發展規劃重點強調依賴不斷的技術創新和逐步深入的融合發展,為軟件和信息服務業向更深、更廣的方向發展奠定技術基礎,提供內在動力。初步形成以“工程項目”為紐帶,以企業為主體,產學研用聯合的技術創新體系;形成以省級軟件工程中心、技術研究中心為高層次深入的工程化、產業化研究中心,在關鍵共性、專業技術領域開發推廣具有自主知識產權的技術和產品;采取“原始創新、集成創新和引進消化再創新”相結合等多種形式,研發一系列關鍵技術,系列核心工業軟件、中間件、高端嵌入式軟件,以及智能搜索、智能挖掘、智能控制、數字音視頻等重點領域的核心產品;創新研發的技術和產品促進了軟硬件的融合、上下游產業鏈的融合、業務與技術的融合等。“規劃”提出“兩化融合”、“五化并舉”、“三網融合”等并逐步實現良性互動;計劃推進云計算、物聯網、寬帶無線通信、數字媒體、軟件服務外包、現代物流等一批擁有較強市場競爭力的新業態建設和應用,實現產業組織模式、商業模式、服務模式、應用模式等的不斷創新,以此帶動山東省軟件與信息服務業產業結構的優化、轉型和升級。
但目前山東省軟件與信息服務業自主創新能力還不夠,沒有形成完整的創新鏈條,自主裝備水平還較低、兩化融合的深度和廣度還不夠,技術與商業模式整合創新不足,網絡與信息安全的問題仍較突出,缺乏核心技術,一些核心軟件仍依靠進口,在云計算、物聯網、智能語音處理等新興領域核心技術的掌握和應用能力方面仍有較大的提升空間。適應產業發展的新形勢、新需要,山東省應不斷優化創新體制、提高創新能力,在技術創新、模式創新和融合發展方面實現提速發展,使融合創新盡快成為推動軟件與信息服務業發展的核心力量。
4.規劃布局
“規劃布局”這一類團包括產業基地、產業園區、名企戰略、支柱產業、龍頭企業、軟件名城、產業聯盟、領域應用、結構調整等關鍵詞。山東省軟件與信息服務業“十二五”規劃提出了“名城、名園、名企、名品”發展戰略,構建起中心城市、特色基地、重點園區為核心,地方、中小型企業為配套的優勢互補的戰略聯盟;優化產業布局和區域布局,具有濟南、青島國內一流的軟件名城,建立東營軟件園、濰坊軟件園、東營軟件園,山東半島藍色經濟區和膠東半島高端產業聚集區,建立煙臺、威海、濰坊、淄博、濟寧、東營、日照等軟件與信息服務業新興聚集區;形成一批具有行業特色、產業優勢、規模效應和品牌形象的龍頭企業;部署了七類重點業務:基礎支撐類軟件、信息安全軟件、工業軟件、行業應用解決方案、嵌入式軟件、信息內容服務、信息技術服務等。
山東省軟件與信息服務業在規劃布局方面還需要解決很多實際問題,如突出發展特色和優勢,明確發展層次和階段,找準軟件園發展方向,形成不同層次、不同特色產業體系、產業結構;根據基地、園區、企業的不同層次,分別給出鞏固擴大、提升壯大、著力培育等不同的明確定位;加大政府規劃監管協調的力度,協調產業布局,避免同類型企業過度集中造成同質化競爭問題,避免人才和資源的惡性競爭,以形成一種良好的發展氛圍。
軟件與信息服務業的快速有序發展是政府、企業、人才和諧發展、良性互動的結果,需要發展要素、發展布局、發展環境、技術創新諸要素之間協調配合,相互促動。綜合上面的分析,結合戰略坐標關系圖,我們將山東省軟件和信息服務業發展驅動模式定位為以“基礎要素”、“發展環境”拉動為主,“融合創新”、“規劃布局”推動為輔的驅動模式。
通過對山東省有關信息化發展“十二五”規劃文件材料的分析,應用ICTCLAS系統和中文文本關鍵詞“詞跨度”提取算法提取關鍵詞,借助Bicom、Spss17.0軟件,對山東省軟件與信息服務業的發展驅動因素進行了可視化分析,結果表明:山東省軟件與信息服務業發展的“基礎要素”已成為其發展的優勢要素,“發展環境”基本成熟,而在“融合創新”、“規劃布局”方面仍顯不足。這與依據《山東統計年鑒》的統計數據,通過DEA方法得出的結論基本吻合[2] [17],而利用可視化方法使研究結果更直觀、更系統。
同一般基于文獻關鍵詞的可視化分析一樣,分析結果會受到關鍵詞規范化、高頻閾值的確定、聚類分析方法的選擇等因素影響;另外,聚類分析是一個無監督的方法,不同的聚類方法得到的聚類結果會存在差異,需靠經驗積累才能找到較好的聚類途經,上述致使本文的研究不可避免地具有一定的局限性。
參考文獻:
[1] 軟件和信息技術服務業十二五發展規劃.[2014-01-10]. http﹕// tech.sina.com.cn/it/2012-04-06/11116918777.shtml.
[2] 王文穎.山東省現代信息服務業現狀及對策研究[D].山東理工大學,2013,06.
[3] 李穆南.北京軟件和信息服務業發展模式研究[D].首都經濟貿易大學. 2012,03.
[4] 劉 宇.北京市軟件與信息服務業發展預測[J].中央財經大學學報,2008,10﹕57-61.
[5] 陳建龍,王建冬.我國地方政府信息服務業發展模式和熱點領域分析[J].圖書情報工作,2009, 63 (24)﹕55-58.
[6] 山東省國民經濟和社會信息化“十二五”發展規劃[2014-01-10]. http﹕//wenku.baidu.com/view/7affe46448d7c1c708a14598.html.
[7] 山東省軟件和信息服務業“十二五”發展規劃[2014-01-10]. http﹕//wenku.baidu.com/view/ a969d4145f0e7cd18425367e.html.
[8] 山東省國民經濟和社會發展第十二個五年規劃剛要[2014-01-10]. http﹕//wenku.baidu.com/view/62248aacdd3383c4bb4cd24c.html.
[9] 謝晉.基于詞跨度的中文文本關鍵詞提取及在文本分類中的應用[D]. 浙江財經大學,2011,12.
[10] 王永進,盛 丹,施炳展,李坤望.基礎設施如何提升了出口技術復雜度? [J].經濟研究,2010,07.
[11] 趙楓.軟件和信息服務業競爭力評價指標體系研究——基于中國服務外包基地的評價[D].東北財經大學,2010,12.
[12] 賴國毅,陳 超,SPSS17統計分析典型實例精粹[M].電子工業出版社.北京.2010,03.146-167.
[13] 鐘偉金,李 佳.共詞分析方法研究(二)[J].情報雜志.2008,(6)﹕141-143.
[14] 張 晗,王曉瑜,崔 雷.共詞分析法與文獻被引次數結合研究專題領域大發展態勢[J].情報理論與實踐,2007,3 (20) ﹕378-380.
[15] 楊皓東,江凌,李國俊.國內自然語言處理研究熱點分析——基于共詞分析[J].圖書情報工作,2011, 10 (55)﹕112-117.
[16] 楊穎,崔 雷.基于共詞可視化的學科戰略情況研究[J].情報學報,2011,3(30) ﹕325-330.
[17] 王 敏.“兩化融合”背景下山東省軟件產業發展戰略及對策研究[J].信息技術與信息化,2013,2﹕19-26.