999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

大數據時代的計算政治學研究

2017-07-18 10:53:18林鴻飛任巨偉
中文信息學報 2017年3期
關鍵詞:分析方法研究

楊 陽,林鴻飛,楊 亮,任巨偉

(1. 大連理工大學 信息檢索研究室,遼寧 大連 116023; 2. 大連理工大學 網絡—信息—科學—經濟計量實驗室,遼寧 大連 116023)

大數據時代的計算政治學研究

楊 陽1,2,林鴻飛1,楊 亮1,任巨偉1

(1. 大連理工大學 信息檢索研究室,遼寧 大連 116023; 2. 大連理工大學 網絡—信息—科學—經濟計量實驗室,遼寧 大連 116023)

政治學研究一直是社會科學領域的熱點研究方向。政治理論、比較政治、公共政策和國際政治等,這些經典的政治學研究課題吸引了大批的政治學學者。從傳統政治學研究中的道德哲學和法理主義,到行為主義政治學研究中的科學方法論和定量分析,再到一些自然科學工作者開始涉足政治學領域,政治學的研究方法一直在發展與演變。該文在對傳統政治學研究的方法進行簡要總結的基礎上,針對互聯網時代,“大數據”驅動下的政治學研究,闡述了計算政治學的起源、定義及其主要的研究內容和方法,論述了目前研究的熱點政治傾向性及政治觀點識別、沖突觀點檢測、選舉預測和分析可視化的研究進展。

計算政治學;計算社會科學;大數據;研究方法

1 引言

隨著大數據時代的來臨,無論是在電視、報刊、廣播等傳統媒體,還是在門戶網站、博客、微博等網絡媒體,都能看到對其大幅的報道與轉載。《大數據時代》的作者維克托指出,我們正處于一個生活、工作與思維大變革的時代。在這個時代中無論是政客、商人還是學者,都會有意無意的與這些數據打交道。一條條購物記錄,一段段微博留言,一趟趟航空旅行,都會化為一條條的電子數據,記錄著生活的軌跡,鐫刻著生命的歷程。如何從這些數據中挖掘其潛藏的價值,就成為了如今學者們研究的熱點。

對于大數據的定義,至今沒有特別權威的解釋,不同的專業領域,不同的學科背景,不同的應用場景都有著不同的闡釋。“大數據”一詞最早源于自然科學研究中,如天文學、生物學、計算機科學等。但如今,這個概念幾乎應用到了所有人類工作、學習和生活的領域中。如圖1所示,在知網中以“大數據”進行關鍵字檢索。從2012~2013年,國內學者對于大數據的研究開始變熱,文章數量呈井噴式的增長。從文章標題和所發期刊來分析,大多數是計算機科學領域對大數據的研究,其中包括對大數據的存儲、并發計算,以及機器學習、文本分析等方法的論述。也有部分文章是在大數據時代下對社會科學,如管理學、社會學、經濟學等研究的探討,具體包括對大數據背景下產品評論挖掘、情感傾向性分析、企業競爭情報的研究、數據新聞報道等。

圖1 與“大數據”相關的文獻數量

在微博、微信、人人網等社交媒體存在的今天,人們幾乎每天都會在各大平臺上分享自己的生活,表達一些觀點和意見。而這些言論所形成的文本數據,以及附帶的圖片、聲音等多媒體數據,對社會科學研究者來說,無疑是最寶貴的財富。如何去獲取這些數據,如何從這些數據中分析管理學、社會學和其他社會科學所關心的問題,以及如何保護用戶隱私,這些都是“大數據”時代下從事社會科學研究的人員所值得關注的問題,這也使得計算社會科學應運而生。

2009年,隨著論文Lifeinthenetwork:thecomingageofcomputationalsocialscience在《科學》雜志上發表,計算社會科學這一嶄新的學科,得到了前所未有的關注。自然科學的計算思維與人文社會科學的相容,無疑給社會科學的研究者們帶來了新的思路,同時多學科的交叉,也加強了研究者們彼此間的交流與合作。

圖2 豐富的社會科學學科

政治學是一門研究政治行為、政治體制以及政治相關領域的社會科學學科[1]。如圖2所示,其與法學、社會學等其他社會科學學科有許多交叉內容,從而產生了許多邊緣學科和交差學科如政治哲學、政治社會學、政治心理學等。在大數據時代,計算社會科學大力發展的背景下,政治學研究者與其他社會科學研究者一樣,面臨著許多機遇與挑戰,諸如,如何從大量的非結構化的數據中,分析政治現象及其背后隱含的關系?如何挖掘個人及團體對某類政治事件的政治傾向?本文將對這兩個問題做出回答。

2 政治學研究

政治學研究的問題最早可以溯源到公元前,當時的政治學研究主要停留于哲學層面,最具有代表性的學者是柏拉圖。其著作《理想國》將道德哲學與一般的社會問題研究融為一體,注重哲學的思辨和抽象的論證,熱衷于探討國家的抽象本質,并以實現“正義”的、“善”的國家為最高目標。

從19世紀末開始,亞里士多德認為人類對自然界進行研究,應當通過實驗和邏輯分析,從而得出自己的結論。這種反傳統、反迷信的主張,對后續的社會科學以及自然科學研究產生了深遠的影響。他所開創的政治科學研究方法,逐漸替代以哲學思辨和抽象論證為主導地位的研究方法。從史實出發,對希臘100多個城邦進行比較和研究。在對比中,探討國家的產生、發展及其功能。這一研究方法還接受19世紀中期孔德的實證社會學和在歐洲興起的實證法學的影響,強調以經驗為根據,著重從法律角度來研究國家、政府機關和司法機構行使權力的問題。這一學派被稱為“法理主義”、“國家主義”,又因其把政治的研究偏重法律一端又被稱為“法律形式主義”。

傳統政治學理論的方法如歷史方法、法律方法和機構方法,帶有濃烈的道德和哲學色彩。政治學要成為一門“科學”,必須拋棄這種方法,對政治現象做“系統的、經驗的和因果的解釋”,以便使政治學能夠成為一門“經驗科學”[2]。

20世紀初,資本主義全面向壟斷階段過渡。隨著各種非政府利益集團以及壟斷組織對現實政治過程影響日益加劇,而法理主義學派對政治學的研究方法,卻依舊停留在對法律體制的靜態描述上。當時部分學者認為,國家的法規和政策的制定權,已經不在政府機構手中,而是掌握在非正式組織和立法機構的一些非正式委員會手里。他們認為,由于傳統學派只分析政治制度而忽略了對人的分析,無法反映現實政治過程。隨著阿瑟·本特利和戴維·杜魯門《政府的過程》*《政府的過程》(1908)一書被認為是團體理論的代表著作。一書的出版,行為主義政治學*行為主義是指20世紀40年代末50年代初在美國崛起并逐漸占居主流的一個政治學流派,稱之為行為主義政治學派,或行為主義學派,它以拉斯韋爾、阿爾蒙德、達爾、尤勞等著名政治學家為代表。流派之一的集團理論登上歷史的舞臺。該書把非政府機構的一些委員會和利益集團的政治行為作為政治分析的中心,通過過程分析和衡態分析方法進行分析,得出國家機構的立法和政府的決策,是由于這些機構彼此之間的相互斗爭、妥協平衡的結果。

二戰期間針對集團政治行為研究的方法逐漸從衡態方法轉向為多學科、協同式的研究方法,重點研究“權力”理論,這也是行為主義政治學方法論的早期發展階段。二戰之后,50~60年代,自然科學的迅猛發展以及計算機的出現,為行為主義政治學方法論全面展開提供了可能。同時行為主義政治學家也竭力利用這一時期自然科學的研究新成就,全面系統地展開研究。

行為主義政治學的研究者們在理論和方法上取得了令人矚目的成就,主要有伊斯頓的政治系統論、阿爾蒙德的結構功能主義、多伊奇的通信理論和西蒙的決策理論[3]。這些理論通過計算機輔助調查和基于統計學、數學、運籌學的定量分析,形成了嚴謹的基于數學公式的問題求解方法。這種定量分析的方法一直延用至今。

行為主義政治學方法,強調運用實證方法研究個體或團體的政治行為,主張政治學研究的“價值中立”*“價值中立”,是相對于價值判斷而言的。由于價值判斷是審美偏好和情感偏好的表達,缺乏客觀性,所以“價值中立”這一原則的主旨在于要求科學家在從事的研究中應當保持客觀態度,不受個人主觀好惡或價值觀念的影響。,但隨著行為主義政治學派的終結,逐漸被后行為主義政治學繼承和改造,并得以揚棄[4]。在“價值中立”這個問題上,一些西方學者認為 “價值中立”觀,脫離了民主與自由,放棄了自己的社會責任,絕對的價值中立會阻礙政治學研究的發展。也正是基于這種新的認識,政治研究者們提出在政治研究的過程中,應當高度關注人的價值,不能對社會矛盾和社會危機視而不見。就此,政治學研究進入了后行為主義時代。

如圖3所示,政治學研究的方法一直在發展與演變。針對互聯網時代,尤其是以大數據云計算為基礎,社交媒體、電子商務、移動終端等新平臺,結構與非結構信息數據爆發的時代背景下,光靠傳統的統計定量分析方法去挖掘這些數據背后的政治問題已經非常乏力。有必要結合計算機科學領域的自然語言處理、分布式計算、機器學習、數據挖掘等相關技術,多學科、多角度地研究與分析。

3 計算政治學概述

研究政治科學的方法通常包括正式的理論構建、敘事分析、定量分析和個案分析等[5]。其中定量分析的方法在20世紀的后半葉出現了一個研究的小高潮,并在21世紀演變成大數據的計算分析[6],且該趨勢得到了社會科學研究者的不斷肯定[7-8]。由于數據驅動下的計算社會科學具備收集并分析大規模數據的能力,因此,社會科學中的政治科學的研究范圍逐步從個體發展到群體及社會[7]。

馬薩諸塞大學阿姆赫斯特分校政治系給了計算政治科學[9]的定義: 計算政治科學不但包含了對網絡、傳感器、通信、電子媒體或電子數據庫等計算機生成數據的分析,而且使用計算形式及語言來描述和分析政治現象。主要計算研究方法包括社會網絡分析、文本分析,基于主題的建模,動態關系或集群模型,數據挖掘等。

目前政治科學的主要研究領域包括: 政治理論、公共政策、國際關系、比較政治。計算政治學也包括以上研究領域,但并不是簡單地使用計算機進行計算, 而是采用計算機科學和信息科學的技術手段分析研究政治科學。計算政治學同樣不同于基于統計的政治科學。由于基于統計方法只能對少量的數據進行處理和分析,其分析方法的精確性依賴于采樣的隨機性,如果采樣過程中存在任何偏見,分析結果就會相去甚遠。這就是為什么在大數據背景下,科學家們提倡利用所有的數據,而不再僅僅依靠一小部分抽樣數據的原因[10]。

圖3 政治學研究方法的發展歷程

在計算政治學中,文本分析通常指計算機自動內容分析或標注,主要涉及詞分析[11-12]、分類聚類[13]、情感分析[14]、主題模型[15]等。政治科學和其他社會科學類似,主要研究人類的生存、競爭、合作、妥協以及社會中的交互,從而計算政治學也少不了對社交網絡的分析,其中主要利用圖論技術來分析并反映上所述各種關系。

目前,國外有很多學者和組織已經展開了計算政治學的研究,主要涉及的方面包括在線政治博客挖掘[16]、人與人之間的社網分析(包括傳統的議會分析[17]、支持總統提名的網絡分析[18])、組與組間的社網分析(例如黨派,興趣組等[19])、互聯網對現實世界的影響及如何在互聯網上改進政治等[20]。Hindman等人發現了政治信息在互聯網上也可以被高度地關注,并且有一些鏈接會被多次引用[21],如一些關于某些政策的網站。在他的工作的基礎上,很多政治學家在電子政府文件上開展了大量的研究,如博弈論、數理邏輯等被視為計算機科學的子領域,也被很好地應用到如選舉投票等方面[22]。還有一些學者利用云計算的特性探討了政治問題的產生[23]。

4 計算政治學研究的主要問題

4.1 政治傾向性及政治觀點識別

對于某類政治事件,不同個人、不同群體、不同階層都有著不同的觀點及看法。如何從微博、博客等這些社交媒體的數據中,判斷個人的政治傾向,進而分析不同群體、不同階層的政治主張,如選民支持率與地域以及階層的關系、個人政治信息的刻畫等,都成為了國外學者主要研究的內容。

Marchetti-Bowick[24]從微博中挖掘公眾的當前情緒,進行政治預測,提出了一種Distant Superision方法來提高主題識別和情感分析的性能,并在一個關于奧巴馬演講的微博數據集上進行了驗證。Balasubramanyan從政治博客帖子中預測評論的極性,對于一個特定政治群體的成員,預測其對不同新聞消息的情感傾向性以及根據帖子的內容預測評論的情感傾向性[25]。也有學者對Twitter用戶所發的內容進行潛在語義分析,從用戶大量的Twitter數據中分析用戶的政治傾向[26]。Abbott分別使用了meta-post特征、上下文特征、依存特征和基于詞的特征、問答特征等多種特征來識別在線討論專欄中的政治觀點。結果表明,使用上下文特征和問答特征能取得68%的準確率[27]。

在政治世界中,有很多人樂于不斷跟蹤觀察某個候選人,一些人甚至建議直接分析Twitter數據中對不同候選人的情感傾向性可以比傳統的投票結果更好,可見傾向性分析成為了計算政治學研究中的一個重要組成部分。值得一提的是Philip Resnik*Philip Resnik認為計算政治學的興起得益于計算社會科學,其主要在計算政治學領域中研究以下三個方面: 實時投票,計算模型在分析政治對話中的作用或效果,傾向性分析。,他沒有重點研究文本數據中情感傾向性的正反,而是將主要精力放在研究如何使用語言來對某一事件產生積極或者消極的影響,例如發現故意制造某些爭論的社會現象[28]等。

4.2 沖突觀點檢測

醫療、教育、住房等這些關乎民生的話題,在社交媒體中經常會受到關注。對于某項政策的頒布或修改,不同的個人或者團體都有著各自的觀點與看法,不同的觀點在表達的同時,會有不同的響應。有些觀點切中要害與部分人看法吻合,會被大量的轉發和支持;某些觀點違背了部分人的意愿,也會被大量的轉發與質疑。對于某類政治事件,往往會有多方觀點共存,這些觀點有的互相補充,有的卻大相徑庭。針對這類問題的研究,包括沖突觀點的識別、檢測與分析,也成為了計算政治學主要研究的內容。

在美國,政治論述越來越兩極化。兩極化導致對同樣的新聞事件,不同的政治團體有不同的反應。針對這種不同反應的研究,可以分析團體的性質、政治主張等。對此許多學者做了相關的研究,Balasubramanyan提出了一個多目標、半監督潛變量模型——MCR-LDA[29]來模擬這個過程,通過分析不同政治組織的政治博客和評論來預測新聞話題引起的兩極化程度。Fang定義和提出了一種挖掘對比觀點的模型,對于一個給定的主題和一系列多觀點評論,首先逐一分析各個觀點,然后量化各個觀點的不同,從而挖掘政治文本中的對立觀點[30]。

針對政治觀點的沖突檢測,研究者所采用的語料大多來自于微博、政論博客、社區論壇等。這些自由的言論幾乎都是非結構化數據,用以往的研究方式和傳統方法很難去定量的分析。于是諸多研究者們開始采用主題模型、文本分類聚類這些計算機文本分析的方法來解決相關問題。

4.3 選舉預測

淘寶可以推薦人們需要的商品,微博可以知道人們的興趣、愛好,騰訊QQ可以猜出人們認識的人是誰,并準確的將其分類。試想,如果人們擁有大量的電子病例檔案,是否可以提前預測疾病,以及推薦合適的治療措施?所以說大數據的核心就是預測[10]。通過以往的數據來預測即將發生的事情,這是多么美妙的一件事情。在計算政治學的研究中,選舉預測也毫無例外的成為了其研究的核心。

選舉預測多指通過分析社交媒體中關于大選的文本內容,量化情感變量,刻畫情感走勢,進而預測大選結果。PLEAD*PLEAD是CIKM一個專門針對政治學的Workshop,其核心是分析在大選中互聯網上的大數據扮演著怎么樣的角色。該Workshop的宗旨是將涉及社會網絡分析的各個研究者集中在一起,解決計算社會科學和計算政治學中的問題。指出在2012年的美國大選中來自互聯網及移動終端的數據對選舉結果及預測方面起到了重要的作用。此外,也有一些其他方面的預測研究,如預測某些事件對于股票走勢的影響,預測哪些政論帖子會受到較高的關注,哪些會得到更多的評論[31-32],通過Twitter進行實時事件檢測[33],社會事件擴散的提前預警[34]等。

針對選舉的預測,國外有大量的學者從事相關的研究,并取得了一定的研究成果[35-37]。2012年美國總統大選時,Nate Silver計算出競選雙方并非處于旗鼓相當的局面,成功預測奧巴馬將有90.9%機會獲得大多數選票,最后也成功預測了美國50個州的投票結果。事實上,2008年的總統大選他也預測對了最終結果,美國50個州的投票結果他預測對了49個,并于2008年大選之后出版《信號與雜音: 預測學的藝術與科學》一書。同樣做相關研究的斯坦福大學教授Simon Jackman*Simon Jackman現為斯坦福大學PSCL(Political Science Computational Laboratory)主任。主頁地址http://jackman.stanford.edu/pscl/開發了以貝葉斯統計理論為基礎的可用于計算政治學領域的R語言工具包。但并非所有的學者都支持和認同這種選舉預測,Daniel Gayo-Avello[38]認為大選預測不但有趣,而且很難!但是大多數的研究者傾向于表明正面的結果,卻不提供有效可再現的方法。Twitter預測大選的能力被過分夸大,許多研究難題依然存在。同時他還指出在利用Twitter數據預測大選時存在很多缺陷,如并沒有一個有效的Baseline,預測都是基于假設所有的Twitter數據都是有價值的等相關問題。

類似于互聯網改變了我們的生活習慣,大數據也將給政治學研究帶來新的方向。各方的爭論,不同思想的碰撞是必不可少的。但無論結果好壞,這將是一場思維的變革。

4.4 可視化研究

可視化是利用計算機圖形和圖像處理技術,將數據轉換成圖形或圖像在屏幕上顯示出來,并進行交互處理的理論、方法和技術。它涉及計算機圖形學、圖像處理、計算機視覺、計算機輔助設計等多個領域[39]。

政治學研究中的可視化,旨在幫助人們更加直觀地理解數據,分析數據中的規律,總結政治現象。Philip Resnik在對實時投票的研究中,利用Analyzing Twitter工具,開發了React Lab系統,該系統可以觀測在線政治爭論。當事件發生時,用戶可通過手機等移動終端實時地討論事件,生成動態的反應,如圖4所示。

圖4 React Lab系統

也有學者通過數據挖掘分析出緊急沖突并對其進行可視化[40],用戶可通過系統進行反饋交互,獲得更好的效果。目前對于政治學領域的可視化研究,學者們并不需要研究可視化底層的知識,大多數都是根據自身研究的情況,依托于已經成型的可視化系統,更加友好、人性化、交互式地展現自己的研究成果。

5 機遇與挑戰

目前,大數據思維已滲入并影響著諸多研究領域,多數學者通常采用4V(Volume、Variety、Velocity、Value) ,即數據體量大、數據類型多、處理速度快和價值密度低,來概括大數據的特征,并以此為基礎在各自領域開展相應的研究工作。然而在社會科學的諸多領域中,受限于數據的規模或技術手段,許多研究工作仍步履維艱,其存在的共性難題主要為以下兩點: 一方面是面對海量數據,缺乏高效的處理方式;另一方面則是數據不足或缺失時,收集領域相關數據代價巨大或無法獲取必要的數據資源。

大數據時代下的海量數據資源,再次點燃了社會科學研究者們的研究熱情,讓他們看到了收集和處理相關信息的希望。面對多元異構的數據源,尤其是社交媒體、網絡博客、垂直型論壇和問答社區的出現,使得用戶可以更加自由地在這些平臺上表達自己的觀點,而這些觀點也更加貼近民眾的訴求。通過主動挖掘社交媒體等數據源中隱含的知識及模式,可以更為全面、實時、便捷地了解用戶的政治傾向等信息,相比于以往的問卷調查等被動收集數據的方式,前者無疑給政治學研究者們帶來了更廣闊的研究空間,且諸多的機遇也蘊含其中。

與此同時,海量的數據標簽及連通的數據網絡(如地理位置、用戶自然信息、偏好、人際圈等),也極大地豐富了政治學研究的內容,拓展了他們的研究視野。分布式存儲及并行計算能力的不斷提高,也降低了大數據的計算和分析大數據的成本,成為解剖大數據的一大利器。情感分析、文本挖掘、自然語言處理、機器學習以及信息檢索等[41-42]方法的不斷發展,更是為其提供了一套完整的收集、整理、分析、整合知識的方法體系,點亮了計算政治學研究的前路。

面對指數式增長的數據,研究者對處理和分析數據的能力提出了更高的要求。如何合理且高效地運用如自然語言處理、數據挖掘以及機器學習等在內的相關技術?如何將思辨分析的模式與這些技術更好地融合,是政治學研究者必須要面對的挑戰。同時,日常生活中密不可分的智能移動終端,五花八門的社交應用,也使得大數據的分析成為了一把“雙刃劍”,竊密事件的層出不窮,絕對的隱私與我們漸行漸遠。因此,如何在大數據時代的研究中保護個人隱私,并規范相應的制度,引入必要的道德標準,也是政治學研究者們必須要解答的難題。綜上所述,大數據時代下的計算政治學研究路途雖坎坷,但前途仍光明。

6 總結

在計算政治學的研究中總是離不開對信息的分析和處理。信息一般分為兩類: 一類是個人信息,另一類是事件信息。個人信息不但包括了個體的自然屬性(名稱、性別、出生日期、職務、特長、愛好等),也包括了個體的社會關系(關系人、關系類型、稱呼、關系強度),通過這些數據構建的數據畫像,能夠反映人作為一個獨立個體和社會成員的全面特征。從個人信息出發,進一步探究人與人的各種關系鏈條,并逐步擴展成為關系網絡,發現特殊群體及奇異個體等重要信息,進而實現從點到面地挖掘不同組織、團體、黨派之間的競爭與合作。

事件信息是另一類研究重點,主要包括各類的政治話題、政治活動等。這類信息在社交網絡的傳播狀態大相徑庭,有的經久不衰,時常見到,如國際沖突、恐怖主義等;有的卻如霎那煙花,曇花一現,但仍迸發出巨大的能量,激起社會情緒的一時波瀾。對于這類信息的傳播過程,我們不但應考量影響信息本身傳播的因素,也應計算并挖掘出哪些個人、團體或黨派在傳播過程中起到了至關重要的作用。

在大數據時代,對于政治學的研究應該是多維度的,和諸多社會科學一樣,其也會發生潛在的變化并與時俱進地發展。為促進國內政治學研究方法的進一步深入并實現與大數據時代的接軌,本文在對傳統政治學研究方法進行簡要綜述的基礎上,重點介紹了近年來國外學者對于計算政治學領域的研究,為廣大的政治學研究者提供借鑒與參照,希望對政治學研究,尤其是計算政治學方面工作的開展有所幫助。

[1] 楊光斌.政治學導論[M].北京: 中國人民大學出版社,2011.

[2] 王滬寧.西方政治學行為主義學派述評[J].復旦學報(社會科學版),1985,(2): 93-98.

[3] 謝宗范.西方政治學研究方法的邏輯發展[J].上海社會科學院學術季刊,1988,(4): 104-106.

[4] 葉娟麗.行為主義政治學方法論研究論綱[J].武漢大學學報(社會科學版),2002,55(5): 594-599.

[5] Political science[EB/OL].http://en.wikipedia.org/wiki/Political science.2014.

[6] Watts D J. A twenty-first century science[J]. Nature, 2007, 445(7127): 489-489.

[7] Lazer D, Pentland A S, Adamic L, et al. Life in the network: the coming age of computational social science[J]. Science (New York, NY), 2009, 323(5915): 721.

[8] Butz W P, Torrey B B. Some frontiers in social science[J]. Science, 2006, 312(5782): 1898-1900.

[9] Leilei Zhu. Computational Political Science Literature Survey[EB/OL]. http://www.personal.psu.edu/luz113/, 2010.

[10] 維克托·邁爾-舍恩伯格,肯尼斯·庫克耶.盛楊燕,周濤,譯.大數據時代[M].杭州: 浙江人民出版社,2013.

[11] Slapin J B, Proksch S O. A scaling model for estimating time-series party positions from texts[J]. American Journal of Political Science, 2008, 52(3): 705-722.

[12] Monroe B L, Colaresi M P, Quinn K M. Fightin′words: Lexical feature selection and evaluation for identifying the content of political conflict[J]. Political Analysis, 2008, 16(4): 372-403.

[13] Purpura S, Hillard D. Automated classification of congressional legislation[C]//Proceedings of the 2006 international conference on Digital government research. Digital Government Society of North America, 2006: 219-225.

[14] Thomas M, Pang B, Lee L. Get out the vote: Determining support or opposition from Congressional floor-debate transcripts[C]//Proceedings of the 2006 conference on empirical methods in natural language processing. Association for Computational Linguistics, 2006: 327-335.

[15] Quinn K M, Monroe B L, Colaresi M, et al. How to analyze political attention with minimal assumptions and costs[J]. American Journal of Political Science, 2010, 54(1): 209-228.

[16] Adamic L A, Glance N. The political blogosphere and the 2004 US election: divided they blog[C]//Proceedings of the 3rd international workshop on Link discovery. ACM, 2005: 36-43.

[17] Fowler J H. Connecting the Congress: A study of cosponsorship networks[J]. Political Analysis, 2006, 14(4): 456-487.

[18] Hans Noel. “A Social Networks Analysis of Internal Party Cleavages in Presidential Nominations, 1972-2008”.[EB]/[OL]. 2009.Available at:http://works.bepress.com/hans_noel/9/.

[19] Koger G, Masket S, Noel H. Partisan webs: information exchange and party networks[J]. British Journal of Political Science, 2009, 39(03): 633-653.

[20] Han J, Kim Y. Obama Tweeting and Twitted: sotomayor’s nomination and health care reform[C]//Processings of the APSA 2009 Toronto Meeting Paper. 2009.

[21] Hindman M, Tsioutsiouliklis K, Johnson J A. Googlearchy: how a few heavily-linked sites dominate politics on the web[C]//Processings of the annual meeting of the Midwest Political Science Association. 2003, (4): 1-33.

[22] Jakulin A, Buntine W, et al. Analyzing the US Senate in 2003: Similarities, networks, clusters and blocs[J]. Political Analysis 2009, 17(3):291-310.

[23] Jaeger P T, Lin J, Grimes J M. Cloud computing and information policy: Computing in a policy cloud?[J]. Journal of Information Technology & Politics, 2008, 5(3): 269-283.

[24] Marchett Bowick M, Chambers N. Learning for microblogs with distant supervision: Political forecasting with twitter[C]//Proceedings of the 13th Conference of the European Chapter of the Association for Computational Linguistics. Association for Computational Linguistics, 2012: 603-612.

[25] Balasubramanyan R, Cohen W W, Pierce D, et al. What pushes their buttons?: predicting comment polarity from the content of political blog posts[C]//Proceedings of the Workshop on Languages in Social Media. Association for Computational Linguistics, 2011: 12-19.

[26] Conover M D, Gon?alves B, Ratkiewicz J, et al. Predicting the political alignment of twitter users[C]//Processings of the ieee third international conference on and 2011 ieee third international conference on social computing (socialcom). IEEE, 2011: 192-199.

[27] Abbott R, Walker M, Anand P, et al. How can you say such things?!?: Recognizing disagreement in informal political argument[C]//Proceedings of the Workshop on Languages in Social Media. Association for Computational Linguistics, 2011: 2-11.

[28] Greene S, Resnik P. More than Words: Syntactic Packaging and Implicit Sentiment[C]//Proceedings of Human Language Technologies: Conference of the North American Chapter of the Association of Computational Linguistics, Boulder, Colorado, USA. DBLP, 2009: 503-511.

[29] Balasubramanyan R, Cohen W W, Pierce D, et al. Modeling polarizing topics: when do different political communities respond differently to the same news?[C]//Processings of the ICWSM. 2012.

[30] Fang Y, Si L, Somasundaram N, et al. Mining contrastive opinions on political texts using cross-perspective topic model[C]//Proceedings of the fifth ACM international conference on Web search and data mining. ACM, 2012: 63-72.

[31] Yano T, Smith N A. What’s Worthy of Comment? Content and Comment Volume in Political Blogs[C]//Processings of the ICWSM. 2010.

[32] Yano T, Cohen W W, Smith N A. Predicting response to political blog posts with topic models[C]//Proceedings of Human Language Technologies: The 2009 Annual Conference of the North American Chapter of the Association for Computational Linguistics. Association for Computational Linguistics, 2009: 477-485.

[33] Sakaki T, Okazaki M, Matsuo Y. Earthquake shakes Twitter users: real-time event detection by social sensors[C]//Proceedings of the 19th international conference on World wide web. ACM, 2010: 851-860.

[34] Colbaugh R, Glass K. Early warning analysis for social diffusion events[J]. Security Informatics, 2012, 1(1): 1-26.

[35] Bermingham A, Smeaton A F. On Using Twitter to Monitor Political Sentiment and Predict Election Results[C]//Proceedings of the Workshop on Sentiment Analysis where AI meets Psychology (SAAIP). IJCNLP, 2011.

[36] Tumasjan A, Sprenger T O, Sandner P G, et al. Predicting Elections with Twitter: What 140 Characters Reveal about Political Sentiment[J]. ICWSM, 2010, 10: 178-185.

[37] Skoric M, Poor N, Achananuparp P, et al. Tweets and votes: A study of the 2011 singapore general election[C]//Processings of the 2012 45th Hawaii International Conference on. IEEE, 2012: 2583-2591.

[38] Gayo-Avello D. “I Wanted to Predict Elections with Twitter and all I got was this Lousy Paper”--A Balanced Survey on Election Prediction using Twitter Data[J]. arXiv preprint arXiv: 1204.6441, 2012.

[39] 可視化. [EB]/[OL]. http://baike.baidu.com/view/69230.htm. 2014

[40] Johansson F, Brynielsson J, Horling P, et al. Detecting emergent conflicts through web mining and visualization[C]//Processings of the Intelligence and Security Informatics Conference (EISIC), 2011 European. IEEE, 2011: 346-353.

[41] 楊亮,林鴻飛,基于情感分布的微博熱點事件發現,中文信息學報[J],2012,26(1): 84-90.

[42] 魏現輝,張紹武,楊亮,林鴻飛.基于加權SimRank 的跨領域文本傾向性分析[J].模式識別與人工智能, 2013,26(11): 1004-1009.

ComputationalPoliticalScienceintheEraofBigData

YANG Yang1,2, LIN Hongfei1, YANG Liang1, REN Juwei1

(1. Information Retrieval Laboratory, Dalian University of Technology, Dalian, Liaoning 116023, China;2. WISE Laboratory, Dalian University of Technology, Dalian, Liaoning 116023, China)

The study of politics has been a hot research spot in the field of social science, such as political theory, comparative politics, public policy, and international politics. From the moral philosophy and legal theory in the traditional politics, to the scientific methodology and quantitative analysis in behavioristic politics, further to the involvement of natural science researchers, the research methods in politics have been developing and evolving. After a brief summary of previous methods in political science research, this paper discusses the origin, definition and development of computational political science at the age of the Internet, especially in the era of big data. It reviews the progress of political orientation, opinion recognition, conflict point detection, election prediction and political analysis visualization.

computational political science;computational social science;big data;research methodology

楊陽(1989—),博士研究生,主要研究領域為專利挖掘、情感計算、科技管理等。

林鴻飛(1962—),博士,教授,博士生導師,主要研究領域為自然語言處理、情感分析與觀點挖掘、信息檢索與信息推薦、社會計算與輿情分析、面向生物醫學領域的文本挖掘等。

楊亮(1986—),博士,講師,主要研究領域為情感計算、文本挖掘、自然語言處理等。

1003-0077(2017)03-0009-08

2015-04-07定稿日期: 2016-01-09

國家自然科學基金(60673039,60973068);國家高技術研究發展計劃(863計劃)(2006AA01Z151)

TP391

: A

猜你喜歡
分析方法研究
FMS與YBT相關性的實證研究
遼代千人邑研究述論
隱蔽失效適航要求符合性驗證分析
視錯覺在平面設計中的應用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
EMA伺服控制系統研究
電力系統不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
電力系統及其自動化發展趨勢分析
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
捕魚
主站蜘蛛池模板: 青青久在线视频免费观看| 日韩中文字幕亚洲无线码| 在线观看精品自拍视频| 色爽网免费视频| 国产粉嫩粉嫩的18在线播放91| 69综合网| 国产丰满大乳无码免费播放| 国产91麻豆视频| 少妇精品网站| 亚洲天堂区| 亚洲欧洲自拍拍偷午夜色无码| 日韩欧美在线观看| 少妇露出福利视频| 在线观看91香蕉国产免费| 一区二区三区四区在线| 亚洲国产成人麻豆精品| 国产人成网线在线播放va| 人妻一区二区三区无码精品一区| 欧美伦理一区| 欧美日韩亚洲国产主播第一区| 久久亚洲黄色视频| 亚洲成肉网| 欧美精品色视频| 国产主播喷水| 久久久久国产一级毛片高清板| 欧美日韩91| 伊大人香蕉久久网欧美| 国产最新无码专区在线| 国产精品第一区在线观看| 麻豆精品在线视频| 国产欧美日韩一区二区视频在线| 91国内视频在线观看| 18禁高潮出水呻吟娇喘蜜芽| 久久夜夜视频| 亚洲第一黄片大全| 国产91av在线| 国产精品粉嫩| 亚洲欧美极品| 白丝美女办公室高潮喷水视频| 色首页AV在线| 日韩精品毛片人妻AV不卡| 久久不卡精品| 日韩在线欧美在线| 欧美在线视频不卡| 成年网址网站在线观看| www.av男人.com| 欧洲亚洲一区| 亚洲色图欧美一区| 国产成人综合网| 免费一级无码在线网站| 亚洲无码电影| 亚洲av成人无码网站在线观看| 国产欧美成人不卡视频| 欧美亚洲国产一区| 成人午夜久久| 国内嫩模私拍精品视频| 亚洲精品视频免费| 一区二区三区成人| 国产最爽的乱婬视频国语对白| 美女视频黄又黄又免费高清| 黄色网站不卡无码| 呦女亚洲一区精品| 幺女国产一级毛片| 综合色婷婷| 强奷白丝美女在线观看| 国产乱论视频| 日韩高清欧美| 美女一区二区在线观看| 中文字幕在线一区二区在线| 精品视频在线观看你懂的一区| 久久精品免费看一| 亚洲三级影院| 久久人体视频| 成人精品免费视频| 毛片手机在线看| 日韩免费中文字幕| 91久久偷偷做嫩草影院电| 国产三级毛片| 国产凹凸一区在线观看视频| 午夜精品一区二区蜜桃| 九九九九热精品视频| 久久精品国产免费观看频道|