劉昊+張志強+田鵬偉+徐婧
摘 要:將文獻計量視角的智庫研究推進到內容單元,既順應了大數據分析在社會科學范疇的發展趨勢,也可為智庫研究、政策研究等領域提供一種新的研究思路和方法。文章運用共詞分析、社會網絡分析等方法,借助自然語言處理技術和可視化技術手段,對2007-2016年期間美國一流智庫在網絡安全領域的文本型成果進行內容分析,繪制了研究區域分布圖、研究主題分布網絡和研究內容演化圖。研究結果發現美國智庫在網絡安全領域的研究區域覆蓋全球,研究議題有安全防務與反恐、國際戰略、關鍵基礎設施和網絡空間發展治理、公共信息安全與法律等四類主要研究方向。
關鍵詞:網絡安全; 美國智庫; 定量分析; 政策文獻計量; 自然語言處理; 內容分析
中圖分類號:G250.2 文獻標識碼:A DOI:10.11968/tsyqb.1003-6938.2017062
Abstract Using biblometrics to analyze the research of think-tanks on the layer of content units conforms to the trend of big data analysis in the social sciences category and can also provide new methods in think-tank research and policy research. This paper uses co-word analysis method, social networks analysis method, NLP and visualization tools to analyze the text type results of American's top think-tanks research in cyber-security during the period from 2001 to 2015. Maps of research area, research topics distribution network and content evolution were drawn. American think-tanks' research in cybersecurity has a global coverage area. There are four research agendas: defense security and counter-terrorism, international strategy, cyberspace development governance and infrastructure, public information policy and law.
Key words cyber-security; American think-tanks; quantitative analysis;biblometrics; natural language processing; content analysis
1 引言
“政策”是政府、政黨及其他團體在特定時期為實現一定的政治、經濟、文化和社會目標所采取的政治行動或所規定的行為準則,它是一系列謀略、法律、法令、措施、辦法和條例等的總稱[1]。一直以來,對政策的分析研究存在偏重質性研究、輕視定量分析的情況,這與政策問題本身的長期、復雜和多因素等特點有重要關系。智庫是一種相對獨立的政策研究和咨詢機構,是政策過程的重要參與者[2]。在現代智庫的目標函數中,“戰略設計”和“政策方案供應”是智庫的兩大突出特點,分別起到監控、預測事物發展精確進程并做出相應調控方略的功能,對應了“希望回答將要發生什么”這一現代智庫的最高境界[3]。同時,前瞻研究重要的戰略問題、進行政策預判并開展政策設計的能力也日益成為國際一流智庫的鮮明標志[4]。從某種程度上而言,現代智庫日益發展成一種研究和提出思想理念并推動政府部門將之變為公共政策行動的持久存在[5]。因此,智庫成果對于政策的分析性研究具有一定的價值。目前,文獻計量視角的智庫研究以對學術期刊文獻的各項指標進行計量分析為主,缺乏對智庫研究成果內容單元的量化揭示。
網絡安全問題近年來備受各國政府關注。2014年2月27日,中央網絡安全與信息化領導小組正式成立,由國家主席習近平直接擔任組長。在中央網絡安全和信息化領導小組第一次會議上,習近平首次提出“網絡強國”戰略,指出網絡安全和信息化是事關國家安全和國家發展、事關廣大人民群眾工作生活的重大戰略問題。隨著特朗普當選美國第45任總統,被譽為“互聯網總統”的奧巴馬將于2017年1月卸任,在其任期的八年內(2009—2016年),網絡安全一直是奧巴馬政府重點關注的領域。本文將以奧巴馬政府時代美國智庫在網絡安全領域的研究成果為例,利用共詞分析、社會網絡分析等方法對文本類型的智庫成果進行量化分析:一是嘗試一種基于政策文本量化角度的智庫成果分析模式;二是對此期間美國智庫在網絡安全領域的研究成果進行可視化,識別研究覆蓋范圍以及研究領域內不同的子群聚類,并結合主題的時序變化,發現研究議題的演化特點;三是將分析結果與同一時間美國在網絡安全方面的重要事件或政策進行關聯,以提高分析結果的可解讀性,歸納智庫成果和政策間的關系。通過本文,既可以豐富情報分析視角的智庫研究方法體系,還能夠洞察美國智庫在網絡安全領域的研究現狀,發揮戰略情報研究在智庫領域的“伐謀”功能。
2 研究現狀
2.1 美國智庫在網絡安全領域的研究
網絡空間是繼海、陸、空、天之后的第五維空間,是一個國家正常運轉的“神經網絡”,自出現以來就成為各國關注的重要領域之一。美國作為世界上軍事和經濟實力最強的國家,在網絡安全領域研究的規模和實力也遠超其他國家。克林頓政府時代,美國就提出了興建信息高速公路的計劃,之后網絡技術滲透到人們生活的方方面面,促成了人類歷史上一次偉大的信息革命,也帶來了大量網絡信息安全領域的挑戰。隨后的小布什和奧巴馬時代,先后經歷了“911”“維基泄密”和“斯諾登”事件的美國政府越來越意識到網絡安全的重要性,通過密集地發布針對性的國家政策、組建專門的政府機構來應對日益嚴峻和復雜的網絡信息安全挑戰[6]。2008年1月8日,小布什政府實施國家網絡安全綜合倡議(CNCI),簽發美國54號國家安全總統令(NSPD-54)和23號國土安全總統令(HSPD-23)[7],正式對“Cybersecurity”(網絡安全)一詞進行了定義,并推出了一系列相關的國家計劃和措施。此后,各類政府機構、研究組織等逐漸開始使用“Cybersecurity”一詞來指代網絡安全。2009年之后,進入奧巴馬時代的美國政府把網絡安全確立為美國經濟和國家安全的最大挑戰。endprint
為了解美國智庫在這方面的研究,本文參考賓夕法尼亞大學智庫研究項目(TTCSP)編寫的最新一期《全球智庫報告2015》[8],考察了10所世界范圍內綜合排名前20的美國智庫。發現其中7所智庫有網絡安全的研究專題,而沒有設置研究專題的智庫在其數據庫中也能夠檢索到網絡安全方面的相關條目(見表1)。
美國智庫在網絡安全領域的研究起步早、影響力大,很多智庫發布的關于網絡安全的研究報告已成為美國政府決策的重要依據。與此同時,網絡安全領域的研究持續升溫,也使得各大智庫加大在該領域研究的投入。根據已有的研究,美國智庫在網絡安全領域的研究可以劃分為四種不同的方向:安全方向、自由方向、國際戰略方向和專業技術方向[9]。這四類不同方向的智庫研究,雖然在一定程度上存在政治立場、關注傾向或者政策影響力方面的差異,但基本構成了美國智庫在網絡安全領域研究的概貌。
2.2 政策文獻計量
政策文獻計量是將文獻計量學的方法遷移到政策分析領域的一種定量分析方法,可用于政策文獻的大樣本、結構化或半結構化分析,為傳統的政策定性研究提供客觀、可重復檢驗的結果[10]。Huang等[11-12]對中國科技政策進行政策文獻計量分析,在常規的編碼量化統計分析時間、機構、政策產出能力等分析之外,通過人工判讀的方式對政策添加關鍵詞標簽,從而進行政策關鍵詞的多維尺度分析,并對發文機構進行共現網絡可視化處理,得出了中國科技政策發文機構的主要合作網絡,以利用可視化工具從中發現高影響力節點所代表的政策文件;王芳等[13]對國內農村信息化政策進行計量研究和內容分析,在對231篇政策文本進行編碼后,通過人工判讀方式對文本添加主題詞標簽,之后結合SPSS軟件進行了主題聚類分析,對主題類目的時間變化進行揭示,并對主題類目進行了關系網絡可視化處理;楊慧等[14]利用R語言對氣候領域政策文本進行主題詞抽取,將文本數據進行降維后利用詞頻數和詞組關系進行領域主題演變的分析[10]。
根據分析方法的不同,本文將已有的政策文獻計量歸納為兩類:一種是基于編碼框架(Coding Framework)的模式[11-13,15-17],另一種是基于自然語言處理(NLP)的模式[14,18-19]。前者根據不同政策文檔集的特點,依賴人工判讀對政策內容進行提煉,形成可以量化統計、可視化分析的數據,對政策內容的揭示較為精確,不足之處在于人力成本較大,需要一定政策領域相關的專業背景知識,方法復用性低(編碼沒有普適性),在處理大體量的政策文檔時比較困難;后者利用自然語言處理技術,可實現對文本數據中的描述性詞組或語義關系等的自動處理,近幾年已被廣泛用于大規模非結構化文本處理、網絡輿情分析等領域,在政策文獻計量領域具有較高應用潛力。
將智庫研究置入政策研究的視角后,亦可把對智庫成果的文本分析歸為政策文獻計量。目前,從學術研究文獻角度分析智庫研究的傳統文獻計量實踐不少[5,20],而直接對智庫成果文本進行計量分析的研究則不多。因此,本文期望通過自然語言處理的方法,將文獻計量視角的智庫研究從文獻單元推進到詞組層面的內容單元,既順應大數據分析在社會科學范疇的發展趨勢,也可為智庫研究、政策研究等領域提供一種新的研究思路和方法。
3 研究數據與方法
3.1 數據來源
由于智庫研究具有一定的前瞻性,故本文在采集數據時將時間起點提前2年,設置為2007年1月1日至2016年12月15日,整個數據集的時間跨度為10年。智庫研究成果的類型眾多,本文對上述幾個智庫的成果類型進行了簡單歸納(見表2)。在這些智庫成果中,除了音頻、視頻等多媒體形式的智庫成果外,其余大多數都可以利用文本分析手段進行量化研究。但為了方便研究過程中的數據采集和處理,本文對所要選取的成果類型進行限定,僅選取網站上公開的研究型成果??紤]到數據集的規模會對文本的共詞矩陣產生影響,規模較小時的共詞矩陣可能比較稀疏,不利于結果呈現。因此,本文的研究將表1中前5所智庫的相關研究成果進行無區分地混合,選取5所智庫的網站作為采集數據的來源,而不再考慮各個智庫研究的側重點、政治立場或傾向等主觀因素。
在數據獲取方面,使用Python Beautiful Soup包對上述5所智庫網站“Cybersecurity”(或相近)專題下的研究型成果的二級鏈接進行掃描,從網頁源碼中抽取條目的標題、摘要(或概述)、發布時間和相關主題標簽等四項內容。Beautiful Soup是Python環境中一個可以從HTML或XML文件中提取數據的包,能夠將非結構化或半結構化的內容源代碼解析成結構化數據[21]。最終,共獲取到425條包含題目、摘要、相關主題、發布時間等四項信息的智庫成果內容,構成本研究的數據集。
3.2 研究方法
3.2.1 數據清洗與高頻詞統計方法
在自然語言處理方面,本文利用Python NLTK包對數據集中各條目的題目和摘要兩種信息進行合并處理:去除停用詞、進行英文分詞和同義詞歸一、利用N-Gram模型抽取單詞或詞組(N=1,2,3,4)、統計詞組在數據集中出現的記錄數d和頻數TF最終獲得的高頻詞數據(見表3)。NLTK是Python環境中一個自然語言處理工具包,包含了大量自然語言處理方面的功能模塊,如語料庫、字符串處理、詞性標識與分類分塊、語義解釋、概率估計等[22]。
考慮到單純以詞頻衡量一個詞在文檔中的重要性并不妥當,忽略了出現次數并不多但較重要的一類詞。因此在獲得詞的頻率和記錄數后,本文利用TF-IDF(詞頻-逆文檔頻率)方法對詞組的權重進行計算,計算公式為:
其中,266為最大詞頻數,425為數據集中文檔的數量。經過這樣的處理,得到一組TF-IDF計算后的高頻詞權重列表(見表4)。與單純的詞頻列表相比,一些詞經過TF-IDF計算后,權重發生了變化。如“中國”超過了“美國”成為權重最高的詞,“斯諾登”“加密技術”等詞的排名上升明顯。本文的研究將采用這一方法統計詞組的TF-IDF權重,并結合領域專家意見從中遴選用于構建共詞矩陣的高頻詞組。endprint
3.2.2 共詞分析與社會網絡分析方法
共詞分析是內容分析方法的一種,其主要原理是對一組詞兩兩統計它們在文檔集中出現的次數,以此為基礎構建這些詞組的共現矩陣,進而揭示領域主題的結構變化[23-24]。共詞分析方法在圖書情報學領域被廣泛應用于結構化文獻數據的分析中,隨著自然語言處理技術的興起與發展,共詞分析方法也開始應用于非結構化的文本數據,并且結合多種可視化方法來呈現分析結果,如戰略坐標圖、聚類譜系圖、多維尺度圖譜和社會網絡分析圖譜等[25]。
社會網絡分析方法能夠從較宏觀的復雜網絡結構中發現個體(節點)關系和局部的網絡關系(聚類),是一種較成熟的網絡定量分析方法[26]。本文分別利用了社會網絡分析方法中的Girvan-Newman算法(G-N算法)和k-核網絡分析方法對關系網絡進行社群聚類、劃分。G-N算法是由Michelle Girvan和Mark Newman提出的一種基于復雜網絡中的邊關系進行網絡子群聚類的算法,該算法利用邊的中介中心性進行聚類計算:首先去除初始網絡中中介中心性最高的邊,形成新的社群網絡,并重新計算新的網絡中中介中心性最高的邊進行迭代計算,直至網絡中不再存在邊為止[27];二人之后又提出Q值模塊概念來優化G-N算法,即此過程中計算不同社群結構的Q值,Q值最大時的社群結構即是該算法計算得到的最優社群結構[28](見圖1)。k-核網絡分析方法最早由Seidman提出[29],是一種基于復雜網絡中節點度進行網絡子群聚類的方法。k核是指網絡中每個節點至少與一定數量k的其他節點相鄰接,即對于網絡Gs的所有節點ni∈Ns而言,如果臨近節點數ds(i)≥k,則Gs是一個k-核網絡[30],k值越大,意味著所形成的網絡中各節點間關系越密切。k-核網絡分析方法在文獻計量學領域可結合共引分析、共詞分析來判斷領域內熱點研究聚類[31]。
4 研究結果
4.1 美國智庫網絡安全研究成果涉及的區域范圍
本文對美國智庫在網絡安全領域研究的區域覆蓋范圍進行可視化,首先構建包含世界上國家和地區名稱的文檔,使用該文檔掃描數據集中425條信息,并統計國家和地區的記錄數,最后將統計結果在世界地圖中進行可視化,得到美國智庫在網絡安全領域研究關注的區域(見圖2)。從圖中可以看出美國智庫在網絡安全領域首要關注的對象是美國本土,其次是中俄兩國、亞太地區、中東地區等。
網絡空間在傳統意義上雖然是虛擬的、無國界的,但實際上網絡空間的主權與安全一直是各國關注的焦點。上述美國智庫對網絡安全研究的關注區域的分析結果表明,美國智庫在網絡安全領域的研究基本上覆蓋了近幾年美國全球戰略部署的重點區域,與美國政府在網絡安全方面的政策、行動有密切關系。2009年5月,奧馬巴宣布在白宮設立網絡安全辦公室,并任命霍華德·施密特(Howard Schmidt)為首任網絡安全協調員。同年6月23日,時任美國國防部部長的羅伯特·蓋茨下令創建網絡司令部,以協調保障美軍網絡安全和開展網絡戰。2011年5月,施密特宣布美國政府出臺針對全球互聯網的首份國際戰略與政策報告——《網絡空間國際戰略》(International Strategy for Cyberspace)[32],該報告第一次把網絡政策與美國外交政策結合在一起,將國家行為的自身網絡空間范圍擴展到全球網絡空間范圍,為配合美國在全球戰略部署中的各項行動、搶占全球網絡空間的主導權制定了路線、方針和措施[33]。
4.2 美國智庫網絡安全研究成果的主題分布
在NetDraw中利用G-N算法對美國智庫在網絡安全領域研究主題的可視化結果(見圖3)。在利用G-N算法進行計算后,Q最大值僅為0.044,得到的最優聚類與原網絡整體的相似度極高(故排除了圖1中Q值曲線較低時另一種聚類過于分散的情況)。本文認為這一結果恰恰反映出美國智庫研究的一大特點:研究議題設置的聚焦程度極高,且在這一議題下相關研究主題之間也具有極高的關聯性。美國智庫具有十分成熟的“旋轉門”機制[34],思想精英在知識和權利之間的“旋轉”推動了智庫成果的“政策化”,但在一定程度上也對智庫研究議題的設置和規劃提出了較高的要求——對研究議題的聚焦程度和研究方向(相關主題)進行明確,以保障“旋轉門”作用下智庫研究的穩定性。
由于結果顯示的網絡節點較多不利于觀察,本文僅顯示了最大聚類中主成分節點(main components)所構成的網絡(見圖3)。從圖中可以發現,美國智庫在網絡安全領域的研究主題大致分為以下四類(以順時針順序):(1)安全防務與反恐;(2)國際戰略;(3)關鍵基礎設施、網絡空間發展與治理;(4)公共信息安全與法律,基本對應了本文提到的四類智庫在網絡安全領域的研究方向。
4.3 美國智庫網絡安全研究成果的內容演化
為分析美國智庫在網絡安全領域研究的演化發展過程,本文將數據集在時間序列上等分為5個階段。抽取每個時間段所對應數據中的高頻詞組構建共詞矩陣,導入NetDraw中進行k-核網絡分析,剔除“Cybersecurity”節點后分別進行呈現(見圖4至圖8)。圖中節點的大小表示對應高頻詞在該時間段的頻率高低,同一形狀的節點形成的網絡為一個聚類。以k值大小進行判斷,位于核心的正方形節點構成了k值最大的聚類(簡稱km聚類),之后是圓形聚類(簡稱kn聚類)和位于周圍的其他聚類。
2007-2008年這一階段并不處于奧巴馬政府時期,但大體揭示出了當時美國政府在網絡安全領域關注的重點方向,形成了分析后續4個時間段內領域研究動態演化的基礎。由于“911”事件的發生,使得打擊恐怖主義成為小布什政府最顯著的執政標簽,也促成了美國網絡安全戰略成果的核心國家戰略之一。這一階段整個網絡的核心節點以國際戰略、安全防務和反恐領域的詞為主也反映出了這種特點,如“U.S”“China”“Iran”等詞構成了位于中心的km聚類,“network”(網絡)“cyber attacks”(網絡攻擊)等詞構成了kn聚類。endprint
進入21世紀以來,網絡威脅被“理所當然”地寫進了一些西方國家宣稱的“中國威脅論”中,中國也“理所當然”地成為美國智庫在此領域的重點研究對象——“China”一詞一直位于5個階段的核心km聚類中。事實上,由于智庫本身就是一個從戰爭當中演化出來的產物,尤其是對于美國智庫而言,把中俄兩國作為安全領域關注的研究對象則顯得更加“理所當然”。
另一方面,伊朗和伊拉克作為海灣地區美國的兩大重點關注對象,出現在了km聚類和kn聚類中。但圖中顯而易見的是,在網絡安全領域,相對于當時美國的海外戰場伊拉克,美國智庫對剛剛(2006年)宣布重啟鈾濃縮并成功產出低純度濃縮鈾的伊朗有更大興趣。在2009年美國國防部成立網絡司令部之前,利用網絡攻擊技術(計算機病毒、DoS攻擊等)破壞有威脅目標的網絡系統甚至核心基礎設施的設想或實驗就一直存在,而圖中這一結果也顯示了當時的美國智庫就已對這一問題進行了較多關注。事實上,在2010年,這種設想“如期”實現:一種被稱為“震網”(Stuxnet)的蠕蟲病毒造成了伊朗境內納坦茲核基地鈾濃縮設施的離心機故障,使得伊朗被迫延緩了核計劃[35]。震網病毒是第一個專門定向攻擊真實世界中工業基礎設施的蠕蟲病毒,其復雜程度和精準的破壞力都把它的制造者指向“國家”級別而非天才黑客,美國和以色列被懷疑聯合實施了這一行動[36]。
2009年1月20日,奧巴馬正式入主白宮后,美國政府在網絡安全領域動作頻頻:(1)組織建制方面,先后成立了網絡空間政策評估小組、白宮網絡安全辦公室以及隸屬于國防部的網絡司令部;(2)政策法規方面,先后發布《網絡空間政策評估》《國家安全戰略》《網絡空間可信身份國家戰略》等。圖5中相對于前一階段網絡結構的特點,“military force”(軍隊)“cyber attacks”(網絡攻擊)“internet”(互聯網)“data”(數據)等詞進入了核心的km聚類,較大聚類Km中除了國際戰略、安全防務和反恐領域的詞之外,還有較多公共信息安全或其他方面的詞,如“privacy”(隱私)等。本階段的網絡中各個聚類的節點大小更加均衡,覆蓋的領域更寬泛,比較客觀地反映出了奧巴馬政府“信息新政”對美國社會方方面面的影響,以及智庫研究跟進頂層政策動向的一種趨勢。
2011-2012年這一階段的網絡結構中,核心聚類km所包含的節點數量大大增多,覆蓋的研究主題方向更加多元,反映出美國智庫在網絡安全領域研究的整體框架已基本形成。對于部分節點而言,上一階段進入kn聚類的“privacy”此時進入了核心聚類km中。而“Asia Pacific”(亞太地區)與“Japan”“Japan alliance”(美日同盟)同時出現在km聚類中,則反映出美國智庫對于“亞太再平衡戰略”(2011年美國總統奧巴馬首次提出)在網絡安全領域的理解:日本是美國在亞太地區的一枚重要棋子,在網絡安全領域也不例外。另外,之前從未出現的“drone”(無人機)直接進入到km聚類中,間接反映出了隨著一系列網絡安全領域政策、措施的推進,美國政府這一方面的態度也逐漸從被動防御發展到主動防御、甚至是主動攻擊的趨勢。
2013—2014年這一階段的網絡結構中核心聚類km較之于前一階段變化不大,但受斯諾登事件的影響,在核心的km聚類之外形成了一個較大的涉及網絡信息安全的kn聚類。2013年6月5日,美國中情局前雇員斯諾登將國家安全局關于“棱鏡”(PRISM)監聽項目的秘密文檔披露給媒體,曝光了美國政府實施大規模電話監聽和互聯網監控的行為,在世界范圍內引起軒然大波。斯諾登事件涉及到國家安全和公民個人隱私之間的沖突和平衡,不同研究視角(立場)對這一事件的定義有較大差異。從美國智庫對該事件的研究來看,部分詞語如“Snowden”(斯諾登)“espionage”(間諜)“public”(公眾)“NSA”(國家安全局)“cyber espionage”(網絡間諜)等都表明其立場更加傾向于美國政府,即將此事件定義為威脅國家安全的泄密行為;之前兩個階段逐漸進入核心聚類的“privacy”節點,在本階段卻并沒有再出現,也能夠說明美國智庫雖曾前瞻性地研究過網絡安全領域的公民個人隱私問題,但在這一事件的跟進上,對“國家安全”問題的研究明顯擠壓了對“公民個人隱私”問題的關注。從整個網絡的結構來看,本階段的節點數量大大增多,節點之間的關系也更為緊密,反映出智庫在此期間的研究內容越來越豐富。
2015-2016年是奧巴馬執政的收官階段,網絡結構圖的結果(為方便觀察將圖中的節點關系閾值設置為2)從智庫角度勾勒出了奧巴馬在網絡安全領域的執政效果:從重點關注國土安全防務到全方位統籌網絡安全領域的發展。2016年2月9日,奧巴馬政府頒布了《網絡安全國家行動計劃》,該計劃是一份承前啟后的政策指南,在總結七年執政經驗的基礎上,給出了美國下一步如何應對網絡安全新挑戰的具體行動方案[37]。
2015年美國國防部發布了《國防部網絡戰略》[38],該報告指出美國面臨的國家層面的網絡安全威脅主要來自俄羅斯、中國、伊朗和朝鮮,同時也承認在2015年以前美國認為中國是其在網絡領域的最大威脅,但2015年后則認為俄羅斯是比中國更強大的對手。圖中同“U.S”一起出現在km聚類的國家也正是“Russia”“China”“Iran”和“North Korea”這四個。其中除了“China”一直處在核心km聚類外,“Russia”和“Iran”曾在km聚類中出現過,而“North Korea”則是第一次進入核心km聚類。更加巧合的是,第58屆美國總統大選過程中爆出“郵件門事件”后,奧巴馬政府方面懷疑俄羅斯涉嫌通過網絡攻擊干預美國總統大選,并于2016年12月29日簽署總統行政令對俄羅斯機構和個人進行制裁[39]。這一系列動作反映出奧巴馬在卸任總統前正式將美國在網絡安全領域的最大威脅瞄準了俄羅斯,本文也就此進行預測:下一個階段的網絡安全智庫研究中,有關俄羅斯方面的一系列問題將會大大增加。endprint
對于其他節點,如在“2009-2010年”和“2013-2014年”曾兩次進入到kn聚類的“intellectual property”(知識產權),本階段進入到了核心的km聚類,說明智庫在網絡安全方面的知識產權研究逐漸深入。在2015年9月習近平總書記訪美時,中美在網絡安全問題上就共同打擊網絡犯罪達成共識,同時也約定各自政府都不從事或在知情情況下支持網絡竊取知識產權等[40]。同時,核心km聚類中包含了網絡安全的4個主要方向,網絡整體結構較之前4個階段相比節點數量最多,節點關系更密集,反映了美國智庫在網絡安全領域的研究框架體系日益成熟,也揭示了美國下一步在網絡安全領域國際戰略部署的主要目標。
5 結論與討論
本文以網絡安全這個近幾年來備受各國政府和國際社會關注的領域為分析問題領域,以美國一流智庫為分析研究對象,以智庫研究議題設置和研究成果與美國的網絡安全政策之間的關聯關系為分析角度,利用共詞分析、社會網絡分析等方法對文本類型的智庫成果進行量化分析,發現了近十年來美國智庫在網絡安全領域研究的發展演化態勢和特點: (1)從地理空間范圍方面來看,美國智庫在這方面的研究與美國政府的全球化戰略部署步調一致——覆蓋全球,重點關注美國本土和被其視為海外核心利益的區域;(2)從研究主題方面來看,有安全防務與反恐、國際戰略、關鍵基礎設施與網絡空間發展治理、公共信息安全與法律等四大類研究方向,各個方向的研究主題“和而不同”、聚焦程度很高,關系十分緊密,這能夠保證智庫研究在“旋轉門”機制下的穩定性;(3)從文本內容演化方面來看,美國智庫網絡安全領域的研究在奧巴馬政府任期內快速發展、逐漸成熟,相關研究與政府政策措施之間的關系緊密,并能夠提前一到兩年對一些問題開展前瞻研究。
實證研究表明,以適當的專家定性分析為指導,利用自然語言處理技術可快速實現對較大規模智庫成果(文本)的結構化處理,形成可供情報分析方法應用的數據單元,以便綜合開展對智庫成果的情報分析活動。這一方法具有較高的可推廣性,既能夠實現某一智庫研究領域的長期跟蹤和動態監測,也可擴展至其他的智庫研究領域。進一步將結果在時間軸上與政策、事件進行關聯,可以發現相關領域智庫研究與政策的關系,甚至智庫成果“政策化”的速度。這一研究模式可為情報學研究、智庫研究甚至政策研究提供一種新思路,其意義具體表現在:(1)提升圍繞政策設計需求開展戰略情報研究活動的能力,最大化發揮情報分析方法在智庫研究方面的功效;(2)洞察一流智庫研究議題的設置特點,掌握國際智庫研究前沿熱點,為國內智庫建設、發展和研究提供學習案例;(3)從“咨政”到“伐謀”,以智庫研究的前瞻性特點為落腳點,分析思想市場態勢變化,及時預判相關政策演化進程并做出針對性研究部署,實現察人之謀、為我所謀。
參考文獻:
[1] 蘇竣.公共科技政策導論[M].北京:科學出版社,2014.
[2] 朱旭峰,蘇鈺.西方思想庫對公共政策的影響力——基于社會結構的影響力分析框架構建[J].世界經濟與政治,2004(12):21-26,4-5.
[3] 牛文元.現代思想庫建設的戰略內涵[J].中國科學院院刊,2014(6):702-707.
[4] 張志強,蘇娜.一流智庫戰略研究成果的質量管理機制[J].中國科學院院刊,2016(8):940-950.
[5] 張志強,蘇娜.國際智庫發展趨勢特點與我國新型智庫建設[J].智庫理論與實踐,2016(1):9-23.
[6] 劉峰,林東岱.美國網絡空間安全體系[M].北京:科學出版社,2015.
[7] The White House.Cybersecurity Policy(U)[EB/OL].[2016-12-03].https://fas.org/irp/offdocs/nspd/nspd-54.pdf.
[8] McGann J G.2015 Global Go To Think Tank Index Report[EB/OL].[2016-12-03].http://repository.upenn.edu/cgi/viewcontent.cgi?article=1009&context=think_tanks.
[9] 魯傳穎.美國智庫在網絡安全政策決策機制中的作用及特點[J].現代國際關系,2015(7):42-49.
[10] 李江,劉源浩,黃萃,等.用文獻計量研究重塑政策文本數據分析——政策文獻計量的起源、遷移與方法創新[J].公共管理學報,2015(2):138-144,159.
[11] Huang C,Su J,Xie X,et al.A bibliometric study of China's science and technology policies:1949——2010[J].Scientometrics,2015,102(2):1521-1539.
[12] Huang C,Su J,Xie X,et al.Basic research is overshadowed by applied research in China: a policy perspective[J].Scientometrics,2014,99(3):689-694.
[13] 王芳,紀雪梅,田紅.中國農村信息化政策計量研究與內容分析[J].圖書情報知識,2013(1):36-46.
[14] 楊慧,楊建林.融合LDA模型的政策文本量化分析——基于國際氣候領域的實證[J].現代情報,2016,36(5):71-81.
[15] 黃萃,蘇竣,施麗萍,等.政策工具視角的中國風能政策文本量化研究[J].科學學研究,2011(6):876-882,889.endprint
[16] 黃萃,徐磊,鐘笑天,等.基于政策工具的政策-技術路線圖(P-TRM)框架構建與實證分析——以中國風機制造業和光伏產業為例[J].中國軟科學,2014(5):76-84.
[17] 張劍,黃萃,葉選挺,等.中國公共政策擴散的文獻量化研究——以科技成果轉化政策為例[J].中國軟科學,2016(2):145-155.
[18] 熊永蘭,張志強,Wei Yongping,等.基于科學知識圖譜的水文化變遷研究方法探析[J].地球科學進展,2014(1):92-103.
[19] Prior L,Hughes D,Peckham S.The Discursive Turn in Policy Analysis and the Validation of Policy Stories[J].Journal of Social Policy,2012,41(2):271-289.
[20] 唐果媛,呂青.我國智庫研究文獻的計量分析[J].智庫理論與實踐,2016(1):31-41.
[21] Beautiful Soup 4.4.0文檔[EB/OL].[2016-12-03].http://beautifulsoup.readthedocs.io/zh_CN/latest/.
[22] (美)伯德,克萊恩,洛佩爾.陳濤,張旭,崔楊,等譯.Python自然語言處理[M].北京:人民郵電出版社,2014.
[23] 馮璐,冷伏海.共詞分析方法理論進展[J].中國圖書館學報,2006,32(2):88-92.
[24] Tijssen R J W,Van Raan A F J.Mapping Changes in Science and Technology: Bibliometric Co-Occurrence Analysis of the R&D Literature.[J].Evaluation Review,1994,18(1):98-115.
[25] 唐果媛,張薇.國內外共詞分析法研究的發展與分析[J].圖書情報工作,2014,58(22):138-145.
[26] Xu H,Guo T,Yue Z,et al.Interdisciplinary topics of information science: a study based on the terms interdisciplinarity index series[J].Scientometrics,2016,106(2):583-601.
[27] Girvan M,Newman M.E.Community structure in social and biological networks[J].Proceedings of the National Academy of Sciences,2002,99(12):7821-7826.
[28] Newman M E J,Girvan M.Finding and evaluating community structure in networks[J].Phys Rev E,2004,69(2):026113.
[29] Seidman S B.Network structure and minimum degree[J].Social networks,1983,5(3): 269-287.
[30] (美)斯坦利·沃斯曼,凱瑟琳·福斯特.陳禹,孫彩虹,譯.社會網絡分析:方法與應用[M].北京:中國人民大學出版社,2012.
[31] 趙麗梅,張慶普.基于科學知識圖譜的我國知識管理研究范式分析[J].情報學報,2012,31(1):95-103.
[32] HOWARD A.SCHMIDT.Launching the U.S.International Strategy for Cyberspace[EB/OL].[2016-12-15].https://www.whitehouse.gov/blog/2011/05/16/launching-us-international-strategy-cyberspace.
[33] 工業和信息化部賽迪研究院.美國網絡空間國際戰略評析[EB/OL].[2016-12-15].http://doc.mbalib.com/view/8709aac409
b0a292d56f08119c969342d.html.
[34] 王莉麗.美國智庫的“旋轉門”機制[J].國際問題研究,2010(2):13-18.
[35] Wikipedia contributors.Stuxnet[EB/OL].[2016-12-15].https://en.wikipedia.org/w/index.php?title=Stuxnet&oldid=756963685.
[36] Ellen Nakashima,Joby Warrick.Stuxnet was work of U.S.and Israeli experts,officials say[EB/OL].[2016-12-15].https://www.washingtonpost.com/world/national-security/stuxnet-was-work-of-us-and-israeli-experts-officials-say/2012/06/01/gJQAlnEy6U_story.html?utm_term=.33fd9a82ac9c.
[37] 李恒陽.美國網絡安全面臨的新挑戰及應對策略[J].美國研究,2016(4):101-121.
[38] The DoD Cyber Strategy[EB/OL].[2016-12-16].https://www.defense.gov/Portals/1/features/2015/0415_cyber-strategy/Final_2015_DoD_CYBER_STRATEGY_for_web.pdf.
[39] The White House.FACT SHEET:Actions in Response to Russian Malicious Cyber Activity and Harassment[EB/OL].[2016-12-15].https://www.whitehouse.gov/the-press-office/2016/12/29/fact-sheet-actions-response-russian-malicious-cyber-activity-and.
[40] 新華網.習近平同奧巴馬共同會見記者指出中美在網絡安全問題上應加強對話合作[EB/OL].[2016-12-15].http://news.xinhuanet.com/politics/2015-09/26/c_1116685158.htm.
作者簡介:劉昊,男,中國科學院大學、中國科學院成都文獻情報中心博士研究生,研究方向:情報研究方法與技術;張志強,中國科學院成都文獻情報中心研究員,博士生導師,研究方向:情報研究方法與技術、學科信息學與領域知識發現、科學學與科學評估;田鵬偉,男,中國科學院大學、中國科學院成都文獻情報中心碩士研究生,研究方向:情報研究方法與技術;徐婧,女,中國科學院成都文獻情報中心助理研究員,研究方向:情報研究方法與技術。endprint