


〔摘要〕大數據時代為人文社會科學研究及其自身的變革迎來了新的發展機遇,人文社會科學領域對大數據相關問題的研究正處于快速上升期。以中文社會科學引文索引數據庫為數據來源,從期刊、作者、研究機構、學科屬性4個層面對國內人文社會科學視野下大數據的主要研究力量進行了分析。通過信息計量與可視化識別出國內人文社會科學視野下大數據研究的六大研究前沿:面向大數據的企業競爭情報研究、大數據時代社會治理與公共服務創新、基于網絡大數據的企業生態系統建模、大數據時代公共圖書館的服務創新與發展、數據新聞、教育大數據及其應用。
〔關鍵詞〕人文社會科學;大數據;研究前沿;信息計量;信息可視化
DOI:10.3969/j.issn.1008-0821.2017.03.024
〔中圖分類號〕G250252〔文獻標識碼〕A〔文章編號〕1008-0821(2017)03-0132-09
〔Abstract〕In the age of big data,humanities and social sciences research and their changes with new opportunities.Research on big data is in the fast rising period in the field of humanities and social sciences.Distribution of researchers of big data in the field of humanities and social science were analyzed from journals,authors,research institutions,subject property amounts to four levels based on Chinese social sciences citation index.In addition,identify six research frontiers of big data in the field of humanities and social science through the use of analysis method of information visualization and informetrics.These research frontiers included study on enterprise competitive intelligence based on big data,innovation of social administration and public services in the age of big data,enterprise eco-system model based on network data,innovation and development of public library services in the age of big data,data news,and education big data and its applications.
〔Key words〕humanities and social sciences;big data;research frontiers;informetrics;information visualization
大數據作為新興產業,其產業鏈條涉及與數據和信息有關的一系列信息技術,可謂是新一代信息技術與信息管理的大變革。伴隨著國家及各省市層面有關大數據發展行動綱要與計劃的陸續出臺,大數據逐漸成為國內外政府管理部門、學術研究機構、工業企業單位的熱門議題。大數據及其技術在人類社會管理、政府治理、經濟文化、教育科學等領域的廣泛應用,使得這一信息技術變成與人文社會科學研究息息相關的一種思維方式,并促使越來越多的人文社會科學研究者開始積極關注和研究與大數據有關的問題。人文社會科學量化研究方法的長期探索為大數據與人文社科研究兩者的結合奠定了較好基礎[1]。方興未艾的大數據已給人文社會科學研究提出了很多問題和挑戰,同時也提供了許多人文社會科學研究變革與創新的機會,人文社會科學研究應自覺融入大數據時代[2]。有研究指出人文社會科學領域與大數據息息相關,人文社會科學領域也高度重視大數據的相關研究[3]。那么目前國內人文社會科學領域對大數據問題進行研究的主要力量分布情況怎么樣?該視野下的大數據研究前沿又是什么?回答這些問題對人文社會科學視野下的大數據研究有一定的參考與借鑒作用。為更好地推動國內人文社會科學領域對大數據相關問題的研究,本文基于中文社會科學引文索引(Chinese Social Sciences Citation Index,以下簡稱CSSCI)對我國人文社會科學領域大數據研究的力量分布及其研究前沿進行識別。
1數據來源說明
鑒于本文是要客觀地反映國內人文社會科學領域的大數據研究現狀及其動向問題,加之考慮到CSSCI在收錄國內人文社會科學期刊數據方面的針對性、權威性、典型性和代表性[4-7],因此,筆者選擇CSSCI數據庫作為數據檢索來源。通過限定篇名和文獻類型雙重條件進行高級檢索,即檢索表達式如下:篇名(詞)=大數據 and 文獻類型=論文,不限定文獻發表時間共計檢索出1 216篇文獻,檢索時間為2017年1月14日。通過進一步的數據清洗工作剔除1篇重復文獻以及與大數據研究內容無關的7篇文獻(主要涉及各大數據庫網站間的對比研究),最后剩余1 208篇論文數據作為分析對象。
根據1208篇文獻在各年度的數量分布數據繪制其年度文獻量及其累計文獻量分布,如表1所示。表1顯示基于CSSCI數據庫來看,國內人文社會科學領域對大數據相關問題的研究始于2012年,并呈現出逐年快速增加的研究態勢,表現為2012年的11篇增長至2013年的115篇,2014年309篇,2015年的474篇,需要說明的是由于檢索時間的原因導致2016年的文獻量收錄更新不全。文獻年度分布情況從數量上反映出人文社會科學領域對大數據的研究關注度在逐年增加,且持續受到人文社會科學學者的高度關注。同時,結合表1的年度文獻量累積分布情況來看,大數據問題研究已成為我國人文社會科學研究領域的研究熱點主題。對大數據年度累計文獻量進行趨勢線模擬,發現其呈現出指數分布,趨勢線公式為:y=76263e11374x,R2=0883。根據擬合值R2可判斷出該趨勢線模擬效果和精度具有較高的可靠性,趨勢線模擬分析表明目前國內人文社會科學領域對大數據相關主題的研究正處于快速上升期,且該領域研究文獻累積量呈現出明顯的指數型變化增長趨勢,筆者相信人文社會科學領域對大數據相關問題的研究熱度還會持續,并從研究數量層面的增加逐步轉向研究內容層面的深入探索,從而不斷推動人文社會科學領域大數據研究的逐步發展與成熟。
從期刊載文量、作者與研究機構發文量可識別出某研究領域的重要情報源和主要研究力量[8]。同時,基于論文學科歸屬的視角也能對某研究領域的主要力量分布情況進行學科層面的宏觀分析。統計分析發現,1 208篇文獻共刊載于267種期刊上,刊均載文約45篇。從期刊來源分布來看,國內人文社會科學領域刊發大數據研究的期刊有209種期刊(占總期刊數量的7828%)載文量在平均值以下,其中包括115種期刊(占總期刊數量的4307%)僅刊發了1篇文獻,49種期刊(占總期刊數量的1835%)刊發了2篇文獻,28種期刊(占總期刊數量的1049%)刊發了3篇文獻,17種期刊(占總期刊數量的637%)刊發了4篇文獻。進一步分析發現,58種期刊(占總期刊數量的2172%)刊發了國內人文社會科學領域大數據研究的843篇文獻(占總文獻量的6978%)。表2統計出載文量大于10篇以上的期刊列表,共載文665篇,其載文量超過總文獻的一半(占總文獻量的5505%),可見這些期刊是目前國內人文社會科學領域大數據研究的重要期刊情報源。表2中前4種期刊均是圖書情報學領域核心期刊,這在一定程度上顯示目前國內人文社會科學領域大數據研究的核心力量來源于圖書情報學學科。
數據顯示,1 208篇文獻共涉及1 036位第一署名作者,占第一署名作者總數約7575%的915位作者僅發表了1篇文獻,97位作者僅發表了2篇文獻,發文量≥3篇的共有24位作者(占第一署名作者總數的232%),高產作者合計發文99篇(占總文獻量的82%)。同時,1 208篇文獻共涉及439所第一署名研究機構,占第一署名機構總數約6059%的266所研究機構僅發表了1篇文獻,66所研究機構僅發表了2篇文獻,發表4篇文獻以上的有80所研究機構(占第一署名研究機構總數的1822),合計發文720篇(占總文獻量的596%)。可見目前國內人文社會科學領域大數據研究者平均發文量很低,高產量的作者數量偏少,
而高產研究機構群正在逐漸形成。基于CSSCI文獻發表數量來分析目前國內人文社會科學領域大數據研究的高產作者(發文量≥3)與高產研究機構(發文量≥10),見表3。表3僅統計以第一署名作者與機構的發文情況,結果顯示中國人民大學新聞學院的喻國明、蘭州財經大學(蘭州商學院2015年改名)信息工程學院的馬曉亭、江西財經大學管理哲學研究中心的黃欣榮、桂林理工大學圖書館的張興旺等學者是目前國內人文社會科學領域對大數據有關問題進行研究的高產作者。而中國人民大學、武漢大學、南京大學、清華大學、北京大學、蘭州財經大學、北京師范大學等研究機構是目前該領域研究的高產機構。
數據處理過程中發現,1 208篇文獻中有72篇文獻沒有標注學科分類,其中有51篇文獻沒有標注中圖分類號,首先筆者根據中國知網CNKI數據庫對這51篇文獻的分類號標注結果進行數據補充,然后再根據文獻內容以及中圖分類號對學科分類信息進行修正完善,最后對學科分類及中圖分類號信息進行統計分析。需要說明的是,對于某些同時具有兩個中圖類號和學科類別的文獻,僅取第一個中圖類號及其所對應的學科類別加以分析。表4是基于CSSCI數據庫的國內人文社會科學領域大數據研究主要學科力量分布列表。表4顯示,目前國內人文社會科學領域大數據研究主要涉及25個學科,其中按文獻量排名的前10門學科分別圖書館、情報與文獻學、新聞學與傳播學、教育學、管理學、經濟學、政治學、統計學、哲學、法學、藝術學。圖書館、情報與文獻學(占總文獻量3005%)是目前國內人文社會科學領域開展大數據研究最活躍的學科力量之一,其次是新聞學與傳播學(占總文獻量1316%),以及教育學(占總文獻量1151%)。為進一步從學科層面顯示人文社會科學領域對大數據有關問題關注的變化情況,筆者將表4中排名前10位學科及其文獻量按照年度進行展示,見圖1。
圖2顯示,從CSSCI來源數據來看,圖書情報學是國內人文社會科學領域最早對大數據相關問題開展研究的主要學科,同時其在文獻數量及增長方面基本領域于其他主要學科,這進一步反映出圖書情報學學科在大數據研究領域的重要地位。進一步分析發現,除新聞學與傳播學、藝術學兩大學科從2015年開始對大數據有關問題的學科關注度有所下降外,目前國內人文社會科學領域大數據研究的其他8門主要學科基本呈現出逐年增加的態勢(由于檢索時間原因導致2016年數據不全)。從圖1可知,教育學對大數據的研究表現出很高的研究熱情,其是在主要學科門類中惟一在2016年數據不全的情況下還表現出增長態勢的學科,教育學在國內人文社會科學領域大數據研究所占比重逐年增加,一定程度上反映出教育學領域對大數據相關問題的研究已經為教育學的研究熱點主題。此外結果還顯示出經濟學對大數據有關問題的研究文獻增長幅度也較快。教育大數據以及大數據環境下的教育問題,以及經濟大數據以及大數據環境下的經濟問題是國內人文社會科學研究領域對大數據有關問題研究的新視角和新拓展。
3研究前沿主題識別分析
研究前沿分析可為科研人員提供某研究領域的發展動態,并能發現具有價值的研究方向或潛在研究領域[9]。同樣,對人文社會科學領域內大數據研究前沿的探測也能識別出人文社會科學視野下大數據領域研究中正受到關注的研究主題或涌現出的具有發展潛力的研究領域,從而有利于更好地推動該領域的科學研究工作。有文獻資料指出,“研究前沿”的概念最早由普賴斯于1965年提出,其被用來描述研究領域的動態本質[10-12]。之后國內外學者對科學研究前沿的探討一直持續,有研究者在總結國內外眾多學者對研究前沿所下的各種定義與概念的基礎上,指出研究前沿就是在科學研究中最近出現、正在興起的研究主題或者研究領域[13]。對于科學研究前沿的有效探測方法而言,其要么根據領域專家的經驗知識進行判斷,要么進行科學計量與文本內容挖掘,而前者相較于后者來看,前一種方法較為費時并帶有較為濃厚的專家主觀色彩,因而科學計量與文本內容挖掘方法是當前快速高效進行科學研究前沿識別的重要輔助手段。目前,基于文獻計量的研究前沿識別基本方法主要有同被引分析、文獻耦合分析、共詞分析等[14]。有研究指出,研究前沿與知識基礎具有密切的對應關系,分析知識基礎有利于對研究前沿本質的認識和理解[15]。同時,從文獻引用關系的方法來看,研究前沿與其對應的知識基礎是不可分割的整體,因而對研究前沿的探測離不開對其在文獻中引用軌跡網絡的分析。國際著名信息可視化專家陳超美教授開發的基于引文分析理論的信息可視化應用程序CiteSpace把研究領域概念化為從知識基礎映射到研究前沿的概念模型,即研究領域被概念化為研究前沿和知識基礎兩者之間的時變映射,而研究前沿是時間變量映射的定義域,其知識基礎是映射的值域[16]。在CiteSpace中,知識基礎是共引文獻網絡,研究前沿由引用這些知識基礎的施引文獻集合組成,而研究前沿領域是從施引文獻中提取的與新趨勢和突變密切相關的專業名詞術語,且共被引文章和引用這些文章的術語的復合網絡中可用研究前沿專業術語概念來作為共引聚類的標簽[17-20]。目前,CiteSpace以繪制知識圖譜的方式常被作為探測學科或領域研究前沿的工具之一[21-25]。
根據研究需要,在CiteSpace功能與參數設置區域中進行相應設置:數據分析時間從2012-2016年,以1年為時區切割;節點類型選擇Cited Reference,數據閾值設定前中后3個時間段的最低被引頻次、本時間切片中共被引頻次、共被引率的參數值為(2,2,20)、(4,3,20)、(3,3,20);同時網絡節點的關聯強度計算方法、可視化結果視圖等選擇默認。經過數據運行和可視化處理生成對應的可視化網絡,并在文獻共引網絡結果可視化界面中進行聚類處理,聚類的標簽大小按照聚類規模進行顯示。為進一步實現聚類的命名處理,從施引文獻的關鍵詞中提取名詞性術語進行聚類命名,這些聚類命名可反映出國內人文社會科學領域的大數據研究前沿,本文的名詞術語提取方法采用對數似然率算法(Log-likelihood Ratio,簡稱LLR)。圖2是基于CSSCI的大數據研究文獻共被引網絡及其聚類可視化圖譜,網絡節點數量163,網絡連線數量431,網絡密度為(2×431)/(163×162)=003264。圖2中網絡模塊化數值Modularity Q=06499,表明網絡聚類效果較好,其社團結構表現顯著,反映聚類內部網絡同質性的平均Silhouette數值=03831。
圖2中節點及其對應標簽字體大小反映出文獻的被引頻次,即文獻被引頻次越高,表現為節點及其對應標簽字體越大。選取被引頻次≥20的共計6篇文獻作為國內人文社會科學大數據研究的高被引文獻。基于CSSCI數據庫來看,按照被引頻次高低,這些重要文獻依次如下:第一篇是2013年孟小峰和慈祥發表的《大數據管理:概念、技術與挑戰》,被引頻次高達66,該文基于對國內外大數據研究成果的梳理和總結,首先探討了大數據的基本概念與應用問題,然后從大數據處理的模式與基本流程兩個方面分析了大數據處理框架問題,并從云計算、大數據處理工具兩個層面分析了大數據管理的關鍵技術,最后從大數據集成、大數據分析、大數據隱私問題、大數據能耗問題、大數據處理與硬件的協同、大數據管理易用性問題、性能的測試基準7個方面探討了目前大數據研究面臨的新挑戰[26]。第二篇是李國杰和程學旗發表的《大數據研究:未來科技及經濟社會發展的重大戰略領域——大數據的研究現狀與科學思考》一文,被引頻次高達62,該文分析了何謂大數據的問題,闡述了開展大數據研究的重要意義,從“數據科學”研究對象、數據關系網絡、大數據研究中的關聯關系與因果關系、社會科學的大數據研究、數據處理的復雜性研究、科學第四范式等六大方面探索了大數據的科學問題,并從大數據的表示方法、存儲與融合、處理與分析工具等方面討論了大數據面臨的挑戰,最后提出了對大數據發展戰略四大建議:優先支持網絡大數據研究、大數據科學的基礎研究、大數據研究的組織方式、大數據研究的資源支持[27]。第三篇是2013年馮芷艷等發表的《大數據背景下商務管理研究若干前沿課題》,被引39次,該文從管理學的角度探討大數據對于現代企業生產管理和商務運營決策等方面帶來的變革與沖擊的研究,提出了3個重要研究視角,分別是社會化的價值創造、網絡化的企業運作、實時化的市場洞察,并討論了四大重要的研究方向與課題,分別是社會化網絡環境中的行為機理與社會資本結構、企業網絡生態系統及其協同共生機制、大數據環境下的顧客洞察與市場營銷策略、基于大數據的商業模式創新[28]。第四篇是2013年鄔賀銓發表的《大數據時代的機遇與挑戰》,被引25次,該文從宏觀經濟、制造業、農業領域、醫療保健領域等方面探討了大數據應用領域,并從大數據挖據的數據收集、數據存儲、數據處理、可視化呈現四大環節探討了大數據技術應用的挑戰[29]。第五篇是王珊等發表的《架構大數據:挑戰、現狀與展望》,被引20次,該文討論了大數據分析平臺需具備的特性,并評價、歸納與對比分析了大數據分析的主流實現平臺:并行數據庫、MapReduce及兩者的混合架構[30]。第六篇是2012年樊偉紅等發表的《圖書館需要怎樣的“大數據”》,被引20次,該文研究了大數據給圖書館帶來的挑戰與機遇,并提出大數據技術及服務可能給圖書館新型知識服務帶來的幫助包括:建立知識服務及業務建設的風險模型、用戶流失分析及價值分析、新型知識服務引擎建設、預測可能的資源故障、網絡化信息資源智能組合方式、對圖書館自然環境、人文環境及技術環境數據多維度大數據的智能分析及智能輔助決策等[31]。除通過文獻被引頻次來識別重要性節點外,還可通過節點的中介中心性來對衡量文獻重要性,進而發現領域內重要的知識基礎文獻[32-33]。節點中介中心性高低可表征對應文獻在學科領域的研究橋梁作用,具有高中介中心性的文獻是某時間段內該學科領域知識演化網絡中的轉折點。在CiteSpace中,中介中心性數值Centrality≥01的節點為高中介中心性關鍵點,節點在圖譜中表現為具有紫色外圈。表5是基于CSSCI的大數據關鍵節點文獻(Centrality≥01)。
圖2中為突出顯示規模較大的一些主要聚類結果,過濾相對較小規模的聚類,在設置圖譜的最小可見的聚類規模大小數值=10。從圖2的聚類命名結果(LLR算法)來看,基于CSSCI的人文社會科學領域的大數據研究前沿主要包括六大聚類,按照聚類規模大小依次是:#0 企業(25)(Silhouette=0788)、#1公共治理(24)(Silhouette=0725)、#2企業生態系統(23)(Silhouette=0802)、#3公共圖書館(22)(Silhouette=0873)、#4程式化(17)(Silhouette=0716)、#5教育大數據(16)(Silhouette=0854)。從各聚類的Silhouette數值來看,聚類成員的相似性較高。本文以LLR算法的命名結果為基礎,并通過進一步分析各聚類對應的施引文獻列表中引用該聚類的文獻比例較高(引用比例≥10%)的施引文獻標題與摘要等信息進一步對六大聚類反映的研究前沿進行解釋命名,分別是面向大數據的企業競爭情報研究、大數據時代社會治理與公共服務創新、基于網絡大數據的企業生態系統建模、大數據時代公共圖書館的服務創新與發展、數據新聞——大數據時代新聞內容生產的新模式、教育大數據及其應用。
31面向大數據的企業競爭情報研究
大數據本身具有的各種特性,以及大數據處理技術給以數據挖掘與分析為基礎的企業競爭情報帶來新的發展機遇與創新路徑。大數據分析在對象、運用的方法和目標等方面都與企業競爭情報研究存在交集,大數據及其技術所帶來的信息生態環境的新變化必然會對企業競爭情報帶來深刻的影響[34]。從數據全面、社會化和及時傳播等特性來看,大數據有利于提高競爭情報的真實性、精準性以及實時性[35]。大數據時代的競爭情報發展動向將更加重視動態競爭情報的分析,即如何從高速動態變化的大數據中獲得動態競爭情報[36]。大數據環境下的企業競爭情報工作需圍繞結構化、半結構化和非結構化大數據三方面進行動態信息全生命周期中各個環節等管理。有學者指出,企業只有不斷基于獲取的動態數據轉化為可供決策的動態情報,才能適應大數據時代的競爭,并探討了面向大數據的企業競爭情報動態運行模式MDD,即以面向大數據的企業競爭情報監控機制、面向大數據的企業競爭情報發現機制、面向大數據的企業競爭情報決策支持機制三者為核心,三者相互配合,并與情報價值鏈條和情報目標鏈條各個環節結合的新模式[37]。同時,基于大數據的企業競爭情報動態信息處理體系具有參與資源的多維異構性、參與資源的跨域關聯性、情報處理過程的多維自組織性、競爭情報服務的多模態性、競爭情報服務模式的顛覆性、體系的可持續發展性[38]。總之,面向大數據的企業競爭情報相關研究,特別是面向大數據的企業競爭情報動態信息處理與分析的理論、模式、體系、方法、技術平臺等研究內容理應成為學界研究者關注和亟待解決的焦點。
32大數據時代社會治理與公共服務創新
基于數據化的政府管理理念與機制,并科學化推動社會治理模式與公共服務方式的創新是大數據時代對智慧政府及其管理的現實要求。大數據技術為政府公共服務改善與創新工作帶來的發展機遇,使政府能以創新的方式和形式提供公共服務,并可助力實現公共治理在服務效率、管理效能與公眾滿意度等方面的不斷提升[39]。大數據時代所帶來數據和信息生態環境的改變給政府社會治理和公共服務領域帶來了重大應用價值。基于大數據技術能夠解決的政府公共治理難題包括諸如公共安全、公共危機管理、食品安全監管、智能交通、公共衛生與醫療、工作就業等[40]。從構成內容來看,大數據公共治理主要包括政府云服務平臺、移動電子政務、數據開放運動以及制度保障4個方面[41]。基于多元化大數據的社會治理與公共服務創新是智慧政府的重要治理特點和方式。大數據時代所帶來的社會治理創新路徑轉向方式包括:從經驗治理導向到精準治理導向、從封閉到開放、從碎片化到整體化、從政府主導走向政社合作治理[42]。大數據時代的新型數據處理技術與國家公共治理過程的精密融合,為實現基于大數據的高效率、高智能、高精準國家社會治理與公共服務創新模式提供了重要突破口,并進而為打造智慧政府提供重要支撐。基于大數據的社會治理與公共服務創新研究前景廣闊,是大數據時代人文社會科學視野下開展社會公共管理研究的重要熱點領域。
33基于網絡大數據的企業生態系統建模
大數據及其技術應用正以各種方式對現代企業管理決策活動產生影響,對企業生存至關重要的企業生態系統也面臨著大數據時代的新變革和新挑戰。大數據時代企業生態系統的產業運行環境、運營模式、合作方式、客戶市場等方面出現了新的特征與變化,基于大數據的企業生態系統演化與構建是迫切需要研究的現實問題[43]。該研究主題可研究大數據環境下基于社會媒體的企業生態系統微觀個體建模、行為規律與交互模式及其宏觀組織結構、共生協同演化及其系統穩定性等關鍵問題,構建可持續發展的企業網絡生態鏈[28]。如何實現基于網絡大數據驅動的具有可持續發展特性的企業生態系統是大數據對于現代企業管理領域的新變革,對于現代企業的科學化管理與決策具有十分重要的作用。因此,基于網絡大數據的企業生態系統建模研究將是大數據時代下學術界和企業界所關心的重要焦點問題。
34大數據時代公共圖書館的服務創新與發展
一方面,大數據與信息、知識之間存在十分重要的關聯;另一方面,大數據技術及其應用不可避免地對圖書館及其服務產生影響。因而圖書情報學成為國內人文社會科學領域較早對大數據相關問題開展研究的主要學科,目前該學科已成為推動大數據研究領域的一股重要發展力量。公共圖書館掌握著巨大的數據資源和信息資源,大數據技術在公共圖書館的應用是業務和時代雙重發展的需要。大數據環境下,以信息處理與信息服務作為優勢的圖書館所開展的服務范圍和業務領域將有更大的擴展和延伸,數據分析服務、數據挖掘服務將成為圖書館知識服務體系創新的制高點[44]。大數據為公共圖書館帶來的發展契機與影響主要表現在三方面:大數據幫助公共圖書館建立和完善新的知識服務、大數據為公共圖書館拓展公共服務提供強有力的技術支撐、大數據對公共圖書館的數據存儲能力和計算能力提出新的挑戰[45]。如何實現基于大數據驅動的新型公共圖書館服務模式、業務內容、技術平臺、應用前景及其績效評價等問題,還亟待圖書情報學等研究人員的積極探討。
35數據新聞——大數據時代新聞內容生產的新模式數據新聞又稱之為數據驅動新聞,是指對基于可以公開獲取的數據進行分析與過濾進而創作出新聞報道的方式,數據新聞有助于實踐“開放新聞”的理念,同時數據可視化是數據新聞的重要組成部分之一[46]。數據新聞作為大數據時代新聞內容生產的新模式,作為基于數據驅動的新聞制作新理念對傳統新聞內容生產的思路與流程產生了一定的影響。大數據對新聞生產的影響表現為新聞生產主體從單一到多元的轉變、新聞生產內容從事實報道到探求規律的轉變、新聞生產方式從專業生產到技術生產[47]。同時在數據新聞的理念逐漸被接受的同時,也有學者指出,大數據技術應用到傳媒行業時,要深刻反思大數據技術的兩面性并予以警醒,并針對大數據對新聞內容生產方面的局限也進行了深入探討[48]。如何通過在新聞傳媒領域科學合理地運用大數據及其技術,通過數據新聞的揚長避短從而實現新聞內容生產創新模式將是大數據時代下新聞傳播學界的重要話題。
36教育大數據及其應用
教育大數據對教育領域改革與創新發展具有重要作用。從戰略層面來看,教育大數據應定位為推動教育變革的新型戰略資產、推進教育領域綜合改革的科學力量以及發展智慧教育的基石[49]。大數據及其技術應用有利于促使教育機構的績效提升和科學過程管理。目前基于教育大數據的應用服務包括:實現在線學習預警[50]、個性化和自適應學習系統[51]、MOOC的資源開發范式[52]、常態化教學及其管理[53]。大數據及其技術的快速發展和在各行業的廣泛應用,引起了教育行業領域的高度重視,如何基于大數據技術將教育領域所積累的海量數據轉變為教育領域的科學管理決策方案已成為大數據環境下教育領域的新熱點和新趨勢。
參考文獻
[1]陳泓茹,趙寧,汪偉.大數據融入人文社科研究的基本問題[J].學術論壇,2015,38(12):106-110.
[2]歐陽康.大數據與人文社會科學研究的變革與創新[N].光明日報,2016-11-10,(16).
[3]趙蓉英,魏緒秋.計量視角下的我國人文社會科學領域大數據研究熱點挖掘與分析[J].情報雜志,2016,35(2):93-98.
[4]湯建民.中國人文社會科學各學科研究論文特征的計量分析[J].科學學研究,2011,29(7):991-998.
[5]譚春輝.高校哲學社會科學創新能力評價指標體系構建研究[J].重慶大學學報:社會科學版,2010,16(2):70-75.
[6]王富國.基于CSSCI的圖書情報學互引分析[J].圖書館,2015,(6):52-59.
[7]馬費成,陳柏彤.我國人文社會科學學科多樣性研究[J].情報科學,2015,33(1):3-8.
[8]呂紅,馬海群.國內政府信息公開研究現狀與展望——邁向政府數據開放[J].現代情報,2016,36(5):158-164.
[9]楊良選,李自力,王浩.基于CiteSpace Ⅱ的研究前沿可視化分析[J].情報學報,2011,30(8):883-889.
[10]Price D J D S.Networks of scientific papers:The pattern of bibliographic references indicates the nature of the scientific research front[J].Science,1965,149(3683):510-515.
[11]Morris S A,Yen G,Wu Z,et al.Time line visualization of research fronts[J].Journal of the Association for Information Science and Technology,2003,54(5):413-422.
[12]陳超美,陳悅,侯劍華,等.CiteSpace Ⅱ:科學文獻中新趨勢與新動態的識別與可視化[J].情報學報,2009,28(3):401-421.
[13]許曉陽,鄭彥寧,趙筱媛,等.研究前沿識別方法的研究進展[J].情報理論與實踐,2014,37(6):139-144.
[14]王立學,冷伏海.簡論研究前沿及其文獻計量識別方法[J].情報理論與實踐,2010,33(3):54-58.
[15]Persson O.The intellectual base and research fronts of JASIS 1986-1990[J].Journal of the Association for Information Science and Technology,1994,45(1):31-38.
[16]Chen C.CiteSpace Ⅱ:Detecting and visualizing emerging trends and transient patterns in scientific literature[J].Journal of the Association for Information Science and Technology,2006,57(3):359-377.
[17]Chen C.Searching for intellectual turning points:progressive knowledge domain visualization[J].Proceedings of the National Academy of Sciences,2004,101(suppl):5303-5310.
[18]Chen C,Leydesdorff L.Patterns of connections and movements in dual-map overlays:A new method of publication portfolio analysis[J].Journal of the Association for Information Science and Technology,2014,65(2):334-351.
[19]Chen C.Predictive effects of structural variation on citation counts[J].Journal of the Association for Information Science and Technology,2012,63(3):431-449.
[20]Chen C,Ibekwe-Sanjuan F,Hou J.The structure and dynamics of cocitation clusters:A multiple-perspective cocitation analysis[J].Journal of the Association for Information Science and Technology,2010,61(7):1386-1409.
[21]侯劍華,胡志剛.CiteSpace軟件應用研究的回顧與展望[J].現代情報,2013,33(4):99-103.
[22]葛莉,劉則淵.國際創業教育研究前沿的可視化分析[J].教育科學,2011,27(2):8-14.
[23]許振亮,郭曉川.50年來國際技術創新研究前沿的演進歷程——基于科學知識圖譜視角[J].科學學研究,2012,30(1):44-59.
[24]Chen C,Dubin R,Kim M C.Emerging trends and new developments in regenerative medicine:a scientometric update(2000-2014)[J].Expert Opinion on Biological Therapy,2014,14(9):1295-1317.
[25]Kim M C,Chen C.A scientometric review of emerging trends and new developments in recommendation systems[J].Scientometrics,2015,104(1):239-263.
[26]孟小峰,慈祥.大數據管理:概念、技術與挑戰[J].計算機研究與發展,2013,50(1):146-169.
[27]李國杰,程學旗.大數據研究:未來科技及經濟社會發展的重大戰略領域——大數據的研究現狀與科學思考[J].中國科學院院刊,2012,27(6):5-15.
[28]馮芷艷,郭迅華,曾大軍,等.大數據背景下商務管理研究若干前沿課題[J].管理科學學報,2013,16(1):1-9.
[29]鄔賀銓.大數據時代的機遇與挑戰[J].求是,2013,(4):47-49.
[30]王珊,王會舉,覃雄派,等.架構大數據:挑戰、現狀與展望[J].計算機學報,2011,34(10):1741-1752.
[31]樊偉紅,李晨暉,張興旺,等.圖書館需要怎樣的“大數據”[J].圖書館雜志,2012,(11):63-68,77.
[32]趙蓉英,王菊.圖書館學知識圖譜分析[J].中國圖書館學報,2011,37(2):40-50.
[33]邱均平,呂紅.近五年國際圖書情報學研究熱點、前沿及其知識基礎——基于17種外文期刊知識圖譜的可視化分析[J].圖書情報知識,2013,(3):4-15.
[34]黃曉斌,鐘輝新.大數據時代企業競爭情報研究的創新與發展[J].圖書與情報,2012,(6):9-14.
[35]吳金紅,張飛,鞠秀芳.大數據:企業競爭情報的機遇、挑戰及對策研究[J].情報雜志,2013,(1):5-9.
[36]劉高勇,汪會玲,吳金紅.大數據時代的競爭情報發展動向探析[J].圖書情報知識,2013,(2):105-111.
[37]鐘輝新,張興旺,黃曉斌.面向大數據的企業競爭情報動態運行模式MDD:監控、發現、決策的互動[J].情報理論與實踐,2014,37(3):6-11.
[38]張興旺,麥范金,李晨暉.基于大數據的企業競爭情報動態信息處理的內涵及共性技術體系研究[J].情報理論與實踐,2014,37(3):121-128.
[39]馬亮.大數據技術何以創新公共治理?——新加坡智慧國案例研究[J].電子政務,2015,(5):2-9.
[40]趙強,單煒.大數據政府創新:基于數據流的公共價值創造[J].中國科技論壇,2014,(12):23-27.
[41]高奇琦,陳建林.大數據公共治理:思維、構成與操作化[J].人文雜志,2016,(6):103-111.
[42]陶希東.大數據時代中國社會治理創新的路徑與戰略選擇[J].南京社會科學,2016,(6):85-90.
[43]資武成.“大數據”時代企業生態系統的演化與建構[J].社會科學,2013,(12):55-62.
[44]程蓮娟.美國推進大數據的應用實踐及其有益借鑒——基于圖書館視角的分析[J].情報資料工作,2013,34(5):110-112.
[45]容春琳.公共圖書館應用大數據的策略研究[J].圖書館建設,2013,(7):91-95.
[46]章戈浩.作為開放新聞的數據新聞——英國《衛報》的數據新聞實踐[J].新聞記者,2013,(6):7-13.
[47]黃俊華.大數據時代新聞生產的挑戰及其應對策略[J].新聞傳播,2014,(12):75-76.
[48]左艷紅.大數據對新聞內容生產的局限[J].編輯之友,2014,(8):63-65.
[49]楊現民,唐斯斯,李冀紅.發展教育大數據:內涵、價值和挑戰[J].現代遠程教育研究,2016,(1):50-61.
[50]王林麗,葉洋,楊現民.基于大數據的在線學習預警模型設計——“教育大數據研究與實踐專欄”之學習預警篇[J].現代教育技術,2016,26(7):5-11.
[51]萬海鵬,汪丹.基于大數據的牛頓平臺自適應學習機制分析——“教育大數據研究與實踐專欄”之關鍵技術篇[J].現代教育技術,2016,26(5):5-11.
[52]吳南中.教育大數據應用于MOOC的資源開發范式研究[J].中國遠程教育,2015(8):23-29.
[53]孫眾,宋潔,姚夏晶,等.教育大數據的課堂應用新形態——“教育大數據研究與實踐專欄”之教學應用篇[J].現代教育技術,2016,26(9):5-10.
(本文責任編輯:郭沫含)