石李妍



摘 要:本文以CNKI期刊庫為數據源,對2007-2017年發表關于中國數字鴻溝研究領域的期刊論文進行收集,分別從發文量、期刊分布、著者、關鍵詞方面進行了統計分析,較為全面地分析了國內數字鴻溝的研究現狀和未來發展趨勢,由于我國接觸數字鴻溝研究時間較晚,研究結果顯示國內數字鴻溝從產生到現在發展比較緩慢。
關鍵詞:中國數字鴻溝 洛特卡定律 期刊分析 關鍵詞分析
中圖分類號:G645文獻標識碼:A文章編號:1003-9082(2019)09-000-02
數字鴻溝是在全球數字化進程中, 不同國家、地區、行業、企業、人群之間, 由于對信息、網絡技術的占有和應用程度不同所造成的“信息落差”、“知識分隔”和“貧富分化”問題[1]。數字鴻溝是信息時代的全球問題。在中國,這個問題不僅體現了信息的滯留問題,還反映了信息時代的社會公正問題。為了更好的把握 國內數字鴻溝問題研究的熱點和規律,本文將對2007-2017年國內數字鴻溝研究論文進行統計和分析,為今后的研究提供參考。
一、數據來源和處理方法
1.數據來源
本文選取CNKI中國期刊全文數據庫作為數據來源,以“主題”為檢索項,“中國數字鴻溝”為檢索詞,時間跨度選取2007-2017年共10年的數據,期刊范圍選取“全部期刊”,以提高檢全率;并設定“精確”以提高檢準率。最終檢索出符合條件的論文共257篇。
2.處理方法
主要借助于EXCEL作為數據分析處理工具,利用其統計及繪圖功能,錄入數據,得出近10年來我國數字鴻溝研究論文的發展規律。
二、論文的年代分布
我們以時間為變量,通過統計分析國內數字鴻溝研究領域的發文情況,按照論文發表年代,得出了其對應的變化趨勢圖,見圖1。
國內數字鴻溝研究的起步較晚,2000年我國數字鴻溝的研究才正式開始,發展比較緩慢。
通過圖1我們可作如下分析:
1.從2007~2011年有關我國數字鴻溝的發文量一直處于上下不斷波動狀態,在25篇左右浮動。原因主要有兩個方面:一是我國數字鴻溝研究領域在這段時期內發展并不成熟,屬于探索階段;二是我國數字鴻溝問題并沒有引起人們的重視,當時并未發展成一個熱點話題。
2.從2011~2013年有關我國數字鴻溝的發文量一直處于下降趨勢,在2013年發文量最少。出現這種情況,一方面,隨著數字鴻溝問題的深化,研究難度增大,影響了學者的研究熱情和信心;另一方面,因學科交叉問題,一些理論概念模糊不清,界定不嚴,該領域的研究呈階段性下降趨勢。
3.從2013~2017年有關我國數字鴻溝的發文量也是處于上下不斷波動的狀態,但發文量都是大于2013年的,2017年的發文量達到最高30篇。出現這種情況,主要是隨著網絡化的不斷普及,同時我國的數字鴻溝現象愈發嚴重,再加上政府的重視,眾多學者對于國內數字鴻溝問題的研究也逐漸深入。
三、作者分布規律分析
1.信息生產者洛特卡分布規律
美國統計學家洛特卡經過研究發現,科學家的生產能力存在一定的規律,他于1926年首先提出了反映作者生產能力的洛特卡定律,即平方反比定律[2]。這里,我們依據這一原理對數字鴻溝的研究論文進行了分析。
洛特卡定律的一般表達式,即:
其中,f(x)為發表x篇論文的作者數占作者總數的比例。在洛特卡的計算過程中排除了高產作者,所以,在這里我們依據洛特卡的原理,只統計發文量小于等于10篇的作者數(見表1),而大于10篇的作者數在所有作者中的比例不到3%,對結果不會造成影響。
我們利用最小二乘法對n 值進行計算,
即:
其中,N為全部作者總數,這里應為186,經計算得出n=2.365618 ,這與洛特卡的結果是基本一致的,符合洛特卡定律。
又因為,x取值為1~∞,但x超過20則忽略不計,所以x最大取20,得出C的值為0.522551。我們經過分析得出我國數字鴻溝領域的洛特卡公式為
為了說明理論計算與實際統計分布的一致性,我們還需進行檢驗。被統計
作者數為186位,經過檢驗,基本符合洛特卡定律。
2.高產作者分析
科學論文的發表是目前評價科技人員創造性勞動的重要指標,科技人員也將發表科學論文作為他們自我表現和確認自己在科學社會中的地位的一種手段。而高產作者和核心作者又是一特定領域的開導者和推進者,因此對高產作者和核心作者的分析非常重要[3]。這里我們用洛特卡定律,以及普賴斯定律對 2007-2017年數字鴻溝研究論文進行分析,以期得出此領域的高產作者和核心作者的分布。首先我們對作者的發文情況進行統計(如表2)
根據普賴斯的研究,我們得知在文獻分布領域內有75%的科學家一生只發表一篇論文[3],根據表1的統計結果,我們得出在數字鴻溝領域寫一篇論文的作者占83.87%。
考慮到多個作者合著一篇論文的情況,我們只統計第一作者,故結果會產生一些偏差,但基本與普賴斯的統計結果一致,
洛特卡在分析作者的生產能力時排除了高產作者,而普賴斯卻注意到了高產作者對學科的推動作用,由此提出了著名的普賴斯高產作者計算公式,其數學表達式為:
其中為最高產作者論文數,M為該學科規定時間內高產作者的論文數。
根據這一定律,我們分析得出在數字鴻溝領域,現在的186位作者中前6位(,M取臨近最大整數3,)作者應該為高產作者,他們的發文量都在三篇以上,如表2所示。可以看出以薛偉賢,劉駿等為首的高產作者群體已經誕生。通過計算他們的H指數發現高產作者的H指數大多在4以上,其中薛偉賢H指數最高,由此可見薛偉賢的論文在該領域影響力最高。
四、期刊分析
我們統計了2007-2017年國內數字鴻溝研究論文期刊共計167種,表7中我們列出了該主題論文的期刊分布情況。
從期刊分布表中可以看出,22種核心期刊中,有12個期刊屬于圖情期刊,占核心期刊的54.56%。說明國內關于數字鴻溝的研究,大部分集中于圖書情報界,其余部分分布在各個領域,范圍較廣。
五、關鍵詞分析
1.關鍵詞的確定和篩選
對來自各期刊的257篇文獻進行統計,共計出現2823個關鍵詞,從中選取高頻關鍵詞39個(詞頻≥4)。由于論文庫中主題詞“數字鴻溝”出現次數很多,不利于統計分析該領域研究熱點,因此本文篩選和整理去掉“數字鴻溝”,對同義關鍵詞進行合并。經過篩選整理,確定了共有39種關鍵詞。
2.高頻關鍵詞的年度統計及分析
為了消除不同年份論文篇數波動造成的影響,以某年度每個關鍵詞出現的次數占當年文章總篇數的百分比作為該年度該關鍵詞的詞頻值。列出了2007-2017的中國數字鴻溝關鍵詞詞頻分布。由表中看出2007-2017年研究中國數字鴻溝問題的論文的高頻關鍵詞主要有“信息化”、“互聯網”、“城鄉數字鴻溝”、“圖書館”等,因此它們也是數字鴻溝研究的熱點問題。
“信息化”、“互聯網”在2007-2017這11年基本上一直是高頻關鍵詞,這與社會背景這一事實是密不可分的,當今時代是一個信息時代、大數據時代,一個問題的出現必然與社會環境密切相關。專家學者分析數字鴻溝這一問題時與時代背景相結合,說明人們對網絡時代有了更普遍、更深入的認識,這表明“信息化”、“互聯網”的出現可能是引發數字鴻溝話題日漸攀升的關鍵之處。通過觀察,自2012年起“城鄉數字鴻溝”多次成為研究我國數字鴻溝這一問題的高頻關鍵詞,是專家學者研究的熱點問題。城鄉發展不平衡,是我國的國情所致,由此看出,專家學者對于數字鴻溝問題進行了更深層次的研究,由時代問題轉向了本國國情。另外,從2007年“圖書館”一直作為高頻關鍵詞,說明可能是在“圖書館”中數字信息資源的使用中學者們發現了數字鴻溝這樣的問題,由此,展開了深入研究。由研究中數據我們可以看出,“信息公平”、“數字不平等”、“和諧社會”等逐漸成為專家學者更深入的研究方向,這也充分表現了我國數字鴻溝問題帶來的影響的深遠性,人們開始逐漸關注數字鴻溝這一問題的出現可能會帶來的不好的影響。
雖然在研究中國數字鴻溝這一方面我們并沒有十分成熟,但具有很強的研究潛力,從縱向和橫向兩方面進一步深化與拓展我國數字鴻溝研究空間,并結合本國國情使研究成果真正具有指導實踐的現實意義,將是數字鴻溝研究未來發展的方向與目標[4]。
綜上所述,可以得知2007-2017年中國數字鴻溝研究熱點包括:信息化、互聯網、城鄉數字鴻溝、圖書館。
六、結束語
本文通過采取文獻計量法,對2007-2017年中國數字鴻溝的研究現狀進行了探析,描述了中國數字鴻溝研究論文分布的期刊研究、作者分布情況、關鍵詞等,發現國內數字鴻溝問題研究目前發展還未成熟,有很大的研究空間,希望本文能為國內研究中國數字鴻溝的學者的進一步深入提供參考。
本次研究最大的不足之處,由于國內對數字鴻溝的研究起步較晚,所以在2007-2017年期間發表的論文數不多。但在未來幾年,中國數字鴻溝研究的領域,我國學者的研究形勢將會越來越好。
參考文獻
[1]胡延平.跨越數字鴻溝:面對第二次現代化的危機與挑戰[M].北京:社會科學文獻出版社,2002.
[2]劉婧.文獻作者分布規律研究:對近十五年來國內洛特卡定律、普賴斯定律研究成果綜述[J].情報科學,2004(1):123-128.
[3]邱均平,王明芝.1999~2008年國內數字圖書館研究論文的計量分析[J].情報雜志,2010,29(2):1-5.
[4]楊凱源,張啟人.數字鴻溝的系統反思[J].系統工程理論與實踐,2002,22(2):1-9.