999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于復旦大學ERU數據的學科交叉程度與研究熱點分析

2015-05-25 02:26:00張春梅張計龍殷沈琴汪東偉郭耀東
現代情報 2015年3期
關鍵詞:學科分析研究

張春梅 張計龍 殷沈琴 汪東偉 郭耀東

(復旦大學圖書館,上海200433)

·信息資源開發與利用·

基于復旦大學ERU數據的學科交叉程度與研究熱點分析

張春梅 張計龍 殷沈琴 汪東偉 郭耀東

(復旦大學圖書館,上海200433)

本文利用復旦大學ERU數據采集平臺,從底層網絡數據中獲取用戶訪問圖書館電子資源時檢索行為的動態數據,運用Session ID關系、因子分析和聚類分析等方法,分析我國高校學術研究的學科交叉程度及研究熱點。結果表明,學科交叉研究采用動態數據源進行分析,可以拓展學科交叉研究的深度和寬度,彌補以往研究中僅針對靜態數據分析研究的不足,促進學術研究和科學創新上獲得新的生長點。

學科交叉;動態數據;Session ID;因子分析;聚類分析

當前學科交叉研究已成為科學技術發展的一個重要趨勢。自20世紀初學科交叉研究的萌芽在美國出現后,人們便開始認識到學科交叉產生的新興學科,因為其能夠打破傳統學科研究束縛,為學科發展創造新的生長點,為科技進步提供新動力的特點,引起世界各國的廣泛關注。學科交叉借助其研究領域的獨特優勢在新技術開發、新興產業應用研究等領域產生極大的影響力,其科學技術創新的能力也被置于極其重要的地位。

發現學科研究的交叉點,無異于找到學科研究的新起點,許多科研人員、學者都希望獲得本學科與其他學科的交叉點、學科研究新的增長點和研究熱點的信息,那么如何從海量文獻數據中發現這樣的信息,為科學發展、研究創新提供動力呢?從目前已有的文獻可以看出幾種研究思路:第一種是以期刊引文關系為基礎研究學科交叉關系[2-4];第二種是通過關聯規則挖掘、文本挖掘等現代數據挖掘技術手段研究學科間的相關性和交叉知識[5-6];第三種是以期刊關鍵詞為基礎研究學科交叉的熱點[7];第四種是以不同的研究對象為基礎,從不同的視角研究學科之間的交叉關系[8-10]。以上文獻多以靜態數據為基礎切入不同的分析角度探討學科之間的交叉關系,但是對學科交叉的程度以及研究熱點缺少量化分析。

本文將以復旦大學ERU數據采集平臺所獲得的用戶使用電子文獻行為的動態數據為基礎進行數據分析。ERU全稱為“圖書館電子資源使用統計分析軟件”,一般部署在高校核心網絡交換機的鏡像口,從旁路出發,基于網絡底層采集用戶信息行為的數據,ERU軟件可以對圖書館實現電子資源知識庫定制管理,對圖書館所使用的數據庫和數據庫中的文獻內容進行用戶使用行為的數據采集,并以此為基礎實現電子資源使用情況的多維統計和用戶訪問行為的統計分析。通過ERU數據采集平臺獲取的動態數據,實現挖掘學科之間可能存在的交叉關系,為更好地揭示學科交叉關系提供一種新思路,不僅通過網絡用戶使用電子文獻資源的行為研究探討學科之間的交叉程度,而且深入挖掘數據的潛在關系對學科交叉的研究熱點也進行分析,為師生、學者和科研人員的研究提供數據參考,幫助其找到學科研究上新的創新點和突破口。

1 研究方法

學科交叉程度的研究分析運用Session ID關系,通過將Session ID中出現的文獻之間的關系轉換為學科之間的關系。以此建立起學科之間交叉關系的基礎,以學科之間交叉出現的頻次作為學科交叉關系程度的反映。學科交叉熱點的研究分析則是利用因子分析,將學科交叉出現的高頻關鍵詞提取出具有代表性的因子,以這些因子為類,分析得出學科交叉的熱點區域,再結合聚類分析,將結果進行比較,獲得較為滿意的學科交叉研究熱點的分析結果。

1.1 Session ID關系運用分析

本文學科之間的交叉關系是建立在Session ID關系的基礎之上獲得的。在Web中Session是指用戶在瀏覽某個網站時,從進入網站到瀏覽器關閉所經過的一段時間,也就是用戶瀏覽這個網站所花費的時間。Session在用戶第一次訪問服務器的時候自動創建,其生成后,只要用戶繼續訪問,服務器就會更新Session的最后訪問時間,并維護該Session。服務器會把長時間沒有活動的Session從服務器內存中清除,此時Session便失效。服務器會分配Session ID給不同的用戶,每個Session ID都是惟一的。文中設Session ID為一個分析對象,在這個分析對象中,所有出現的文獻被認為是存在關聯關系的,它們之間的關聯關系將作為學科之間建立交叉關系的基礎。

(1)明確一個Session ID中包含的每篇文獻的學科分類。文獻學科分類確定好之后,Session ID中出現的文獻之間的關系轉換為學科之間的關系。

(2)再以Session ID為基礎,交叉運算每一個Session ID當中存在的兩學科、三學科甚至多學科之間的相互交叉關系。假設一個Session ID當中有若干篇文獻,每篇文獻都有學科歸屬。文獻1學科分類為A,文獻2學科分類為C,文獻3學科分類既屬于學科A又屬于學科B,此時認為A和B學科之間存在交叉關系,A和C學科,B和C學科,A、B和C學科之間都存在學科交叉關系。在同一篇文獻中出現的交叉關系定義為內在關系,同一個Session ID中出現的交叉關系定義為外在關系。學科之間每出現1次交叉計算1次出現頻次,以學科之間交叉出現的頻次作為學科交叉關系程度的反映。

(3)學科交叉的研究的熱點分析,也同樣引入Session ID關系影響因素,擴大文獻中出現的關鍵詞關聯關系,同一個Session ID的用戶使用文獻的學科關鍵詞,關鍵詞的共現頻次不僅需要計算在同一篇文獻中兩兩共現的次數,而且還要計算同一個Session ID中關鍵詞的兩兩共現次數。同一篇文獻中出現的關鍵詞的共現關系定義為內在關系,同一Session ID出現的關鍵詞的共現關系定義為外在關系。

1.2 因子分析

因子分析最早是由英國心理學家斯皮爾曼提出的,是一種從變量群中提取共性因子的數據簡化統計技術。因子分析通過研究眾多變量間的內部依賴關系,探求觀測數據中的基本結構,找出變量中隱藏的具有代表性的因子,將相同本質的變量歸入一個因子中,減少變量的數目,同時檢驗變量間的假設關系,用假想的變量能夠反映出原來眾多變量的主要信息[11]。換句話說,因子分析是尋找潛在的、起支配作用因子的方法。通過因子分析,將學科交叉出現的高頻關鍵詞提取出具有代表性的因子,以這些因子為類,分析得出學科交叉的熱點區域。

2.3 聚類分析

聚類分析又稱群分析,起源于分類學,是一種探索性分析方法,能夠分析事物的內在特點和規律,并根據相似性原則對事物進行分組,是數據挖掘中常用的一種技術。它特別適用于沒有先驗知識的分類。如果沒有這些事先的經驗或一些標準,分類便會顯得隨意和主觀,這時只要設定比較完善的分類變量,就可以通過聚類分析法得到較為科學合理的類別[12]。學科之間交叉后會產生怎樣的知識分類,事先是無法得知的,通過聚類分析,可以分類得出,這樣就可以與因子分析的結果進行比較,獲得較為滿意的學科交叉研究熱點的分析結果[13]。

2 數據采集與分析

本文以復旦大學ERU數據采集平臺所獲得的用戶使用電子文獻行為的動態數據為基礎,從底層網絡數據中獲取用戶對學校訂購的所有中文數據庫的檢索、瀏覽、下載等信息行為的日志數據,及對應數據庫文獻信息,如關鍵字、作者、引用、發表時間等數據。數據采集時間為2013年8月到2014年2月的有效數據共241 464條,有48 000多個Session ID,平均每個Session ID有5條左右記錄。

2.1 學科交叉程度分析

在數據分析中學科分類采用的是《中國圖書館分類法》,以此為基礎揭示學科之間的交叉情況。將采集到的有效數據與Session ID結合,按照上文介紹的運算規則分析,并且對于同一篇文獻中學科交叉頻次,賦值為0.6,同一Session ID出現的學科交叉頻次,賦值為0.4,獲得的學科交叉程度結果如下(見表1):

表1 學科交叉頻次表(部分)

如表1所示,通過Session ID關系分析動態數據獲得相關學科交叉的頻次數據,它反映出復旦大學師生、科研人員和學者在相關研究中學科之間的相互交叉關系。首先,兩學科交叉排序前3位的為:D(政治、法律)和F(經濟);F和G(文化、科學、教育、體育);D和G。三學科交叉排名前3位的為:D、F(經濟)和G;C(社會科學總論)、D和F;C、F和G;四學科交叉排名前3位的為:C、D、F和G;D、F、G和K(歷史、地理);D、F、G和R(醫藥、衛生)。政治經濟學科交叉融合本身已經較為成熟了,通過此次的數據說明它們的交叉融合程度是很高的。第二,學科交叉中的活躍學科:C、D、F、G、K,都屬于傳統的社會人文科學,這與復旦大學屬于綜合性大學,學科設置偏重社會人文科學相符,這些學科大多為其他學科提供理論指導,較易與其他學科發生交叉。第三,在所有學科交叉中沒有出現E(軍事)、J(藝術)、P(天文、地球)、U(交通運輸)、V(航空、航天)等學科分類,這也是與復旦大學學科設置較為相符。第四,體現出學科交叉的發生,既存在于學科的內部,也存在于學科之間,甚至是存在于學科“界”之間。第五,兩學科以上的學科交叉的發生,都是以兩學科為基礎,不斷融入新的學科知識。

2.2 學科交叉熱點分析

2.2.1 學科交叉高頻詞統計

根據以上分析得到的學科之間交叉情況的數據,本文將以排名首位的D和F為例,分析學科交叉的熱點。首先利用Bibexcel軟件對從ERU采集的相關學科交叉數據進行關鍵詞詞頻統計(見表2),然后挑選高頻關鍵詞,形成相關共詞矩陣(見表3)。手動將關鍵詞中無意義的或與其他關鍵詞聯系少的關鍵詞剔除,生成高頻關鍵詞共詞矩陣。共詞矩陣中關鍵詞的共現次數不僅計算在同一篇文獻中共現的次數,而且還要計算同一Session ID中不同文獻關鍵詞的共現次數。對于同一篇文獻中關鍵詞的共現次數,賦值為1;同一Session ID出現的關鍵詞的共現次數,賦值也為1。

表2 高頻關鍵詞分布表(降序)

表3 DF 共詞矩陣(部分)

2.2.2 學科交叉熱點分析

本文在學科交叉熱點分析中,以SPSS軟件作為統計分析的工具進行因子分析和聚類分析。因子分析中,考慮到所建矩陣包含有內在共詞關系和外在共詞關系的因素,而且邱均平老師已在其文章中驗證可以將原始矩陣直接作為輸入矩陣,事先不需要任何轉化[14]。另外,SPSS軟件為了消除不同變量間量綱和數量級對結果的影響,在該過程中默認自動進行標準化處理,不再對這些變量提前進行標準化處理,因此本研究的矩陣均未進行轉化。在此基礎上,利用主成份法、相關性矩陣與旋轉——最大方差法進行因子分析。聚類分析中,共詞矩陣也未作轉化,運用系統聚類、相似性矩陣、組間連接和余弦方法進行聚類分析。

(1)學科交叉熱點因子分析

表4 DF公因子方差

表5 DF 解釋的總方差

表5 (續)

圖1DF因子分析碎石圖

表4顯示,提取因子后公因子方差的值均很高,表明提取的因子能很好地描述這31個關鍵詞。表5因子分析方差分解表(解釋的總方差)表明,前7個因子特征值大于1,這7個因子能夠解釋31個指標的81.229%,而僅前3個因子的信息解釋量就達52.997%。圖1DF因子分析碎石圖也表明,從第8個因子開始,特征值差異減小。綜合以上結果,提取前7個因子。

表6 DF 旋轉成份矩陣

表6 (續)

由表6因子分析旋轉成份矩陣可以看出,經旋轉后,因子便于命名和解釋。為便于識別,將因子負載絕對值大于0.5的關鍵詞制作成如表7。

表7 因子分析確定的DF 學科交叉熱點研究

從表7因子分布情況可以看出,因子分析結果中的關鍵詞總體分布有如下特點:

①絕大多數關鍵詞都歸于相應因子。根據因子載荷大于0.7就對因子解釋有幫助的原則,并綜合因子中其他關鍵詞的屬性,對7個因子進行歸類命名和解釋,如表7所示。

②有兩個關鍵詞跨區分布。關鍵詞“金融危機”同時出現在第1、第7個因子中,它們的因子載荷系數均在0.6左右,體現這兩個因子——“新自由主義問題”、“歐盟金融危機問題”之間的相關性。

③有2個關鍵詞的因子載荷系數為負,同相應因子構成負相關關系。如:第5個因子中的“農民工”(因子載荷系數為-0.530),“社會保障”(-0.529)。

(2)學科交叉熱點聚類分析

圖2DF系統聚類分析樹狀圖

表8 DF 關鍵詞與序號對照表

聚類分析的結果,如果沒有因子分析的結果做比較,僅依靠聚類分析的結果,分析難度明顯較大,既無法確定分為幾類合適,也無法有對聚類的類進行命名的依據。結合因子分析的效果,可以明確地將關鍵詞分為6大類:新自由主義問題、政府公共政策與服務問題、國家或區域的國家安全與發展問題、國有企業出路問題、中國改革開放問題、城市化發展過程中產生的問題。需要說明的是第9號關鍵詞“農民工”在因子分析中與第5個因子是負相關關系,而又與其他因子沒有正相關關系,但是與第24號關鍵詞“社會保障”又是緊密相關的(都與第5個因子是負相關關系)。而第21號關鍵“歐盟”所屬同一個因子(第7)的第29號關鍵詞“金融危機”是跨因子分類的,二者無法再聚類,則其與第3個因子的所有關鍵詞聚為一類,形成國家或區域的國家安全與發展問題研究。歸納以上分析,最后確定DF學科交叉熱點分析結果如表9所示。

表9 DF 學科交叉研究熱點

(3)學科交叉熱點綜合分析

各個學科由于發展程度不同,研究重點不同,對于相同的問題的認識解決程度也不同。學科交叉研究熱點所反映出的對于相同問題的解決,各個學科會采用不同的學科理論,同時也會運用其他學科的理論幫助問題的解決。對于某學科早已形成的成熟理論被其他學科用來解決不同學科的問題,說明前者學科的理論得到推廣和擴展,而后者學科找到了理論的源頭,指導解決問題的研究,說明交叉融合的學科越多,解決問題所面對的角度也就越多。

3 結語

本文與以往學科交叉研究不同之處在于通過運用ERU數據采集平臺,采集到用戶在訪問圖書館的各類電子資源數據庫的各種行為,從網絡底層統一獲取其動態數據,利用Session ID關系、因子分析和聚類分析的方法,對學科交叉程度以及學科交叉的研究熱點進行分析。這一研究方法開拓了數據源的使用,拓展了研究的寬度,并且彌補了以往研究中僅針對靜態數據分析研究的不足。本文也存在很多不足之處,如:分類不夠細化、數據量少、數據優化欠缺等。分析研究對象的數據量較窄,如何增加分析對象數據,擴大此研究方法的適用范圍,是未來研究的重點。此外,對數據的解讀,具有一定的主觀性。未來在研究中將會增強對分析數據源以及分析方法的應用,采取更加合理的學科分類方法,提高數據量,找到合適的關鍵詞篩選方法,對數據進行合理分析,獲得學科交叉的程度和學科交叉研究熱點等信息,促進在學術研究和科學創新上激發新的生長點的出現。

[1]薛瀾.關于學科交叉問題的一些理論探討[J].中國科學基金,1997,(1):59-64.

[2]楊建林,孫明軍.利用引文索引數據挖掘學科交叉信息[J].情報學報,2004,(6):672-676.

[3]闞連合,黃曉鵬,劉梅申.情報學交叉學科的發展趨勢——我國情報學期刊被引分析的啟示[J].現代情報,2007,(1):62-64.

[4]李長玲,紀雪梅,支嶺.基于E-I指數的學科交叉程度分析——以情報學等5個學科為例[J].圖書情報工作,2011,(6):33-36.

[5]王昊.基于關聯規則挖掘研究學科間相關性[J].現代圖書情報技術,2005,(3):23-28.

[6]魏建香,孫越泓,蘇新寧.學科交叉知識挖掘模型研究[J].情報理論與實踐,2012,(4):76-80.

[7]閔超,孫建軍.學科交叉研究熱點聚類分析——以國內圖書情報學和新聞傳播學為例[J].圖書情報工作,2014,(1):109-116.

[8]張春美,郝鳳霞,閆紅秀.學科交叉研究的神韻——百年諾貝爾自然科學獎探析[J].科學技術與辯證法,2001,(6):63-67.

[9]劉煜,劉仲林.學科交叉中的科研創新契機——以中科院院士增選為例[J].科技進步與對策,2005,(12):61-63.

[10]于江,黨延忠.用信息可視化方法分析科研領域發展狀況[J].科學學與科學技術管理,2009,(6):10-14.

[11]吳駿.SPSS統計分析從零開始學[M].北京:清華大學出版社,2014:261-278.

[12]聚類分析[OL].http:∥wiki.mbalib.com/wiki/%E8%81% 9A%E7%B1%BB%E5%88%86%E6%9E%90,2014-06-06.

[13]吳駿.SPSS統計分析從零開始學[M].北京:清華大學出版社,2014:279-295.

[14]邱均平.關于共被引分析方法的再認識和在思考[J].情報學報,2008,(1):69-74.

(本文責任編輯:郭沫含)

An Analysis of the Degree of Inter-disciplines and Research Hotspots:Based on Fudan University ERU Data

Zhang ChunmeiZhang JilongYin ShenqinWang DongweiGuo Yaodong

(Library,Fudan University,Shanghai 200433,China)

This article studied the degree of inter-disciplines and research hotspots by making use of the methods of Session ID,Factor Analysis,and Cluster Analysis,on the basis of the Fudan University ERU data of searching behavior of the library digital resources.It improved the research on inter-disciplines through the use of data sources,and made up the shortfall of static data analysis.

inter-disciplines;dynamic data;session ID;factor analysis;cluster analysis

10.3969/j.issn.1008-0821.2015.03.013

G250.73

A

1008-0821(2015)03-0068-09

2014-12-17

國家社科基金“泛在知識環境下圖書館知識發現技術與應用研究”(項目編號:12CTQ006)。

張春梅(1979-),女,館員,碩士,研究方向:信息服務、館藏建設。

猜你喜歡
學科分析研究
【學科新書導覽】
FMS與YBT相關性的實證研究
遼代千人邑研究述論
土木工程學科簡介
隱蔽失效適航要求符合性驗證分析
視錯覺在平面設計中的應用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
EMA伺服控制系統研究
電力系統不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
“超學科”來啦
電力系統及其自動化發展趨勢分析
主站蜘蛛池模板: 欧美日本激情| 91免费观看视频| 91久久偷偷做嫩草影院电| 国产成人超碰无码| 茄子视频毛片免费观看| 777午夜精品电影免费看| 特黄日韩免费一区二区三区| 久久午夜夜伦鲁鲁片不卡| 91成人免费观看在线观看| 国产制服丝袜无码视频| 亚洲乱伦视频| 制服丝袜一区| 免费无码AV片在线观看国产| 五月丁香在线视频| 欧美成人亚洲综合精品欧美激情| 国产成人一级| 男女性色大片免费网站| 91亚洲影院| 久久久久无码精品| 在线播放真实国产乱子伦| 永久免费av网站可以直接看的| 国产丰满大乳无码免费播放| 亚洲有无码中文网| 在线观看国产精品第一区免费 | 国产欧美视频在线| 99色亚洲国产精品11p| 国产又粗又猛又爽视频| 九九线精品视频在线观看| 亚洲av无码专区久久蜜芽| 国产拍揄自揄精品视频网站| 欧美精品导航| 午夜限制老子影院888| 国产中文一区二区苍井空| 青草娱乐极品免费视频| 99在线视频免费观看| 毛片最新网址| 毛片在线区| 国产一区亚洲一区| 亚洲欧美日韩综合二区三区| 福利国产微拍广场一区视频在线| 熟女视频91| 一级一级一片免费| 囯产av无码片毛片一级| 国产乱子伦手机在线| 国产亚洲欧美在线中文bt天堂| 亚洲欧美国产五月天综合| 91日本在线观看亚洲精品| 91精品啪在线观看国产91九色| 四虎永久在线| 欧美国产中文| 欧美日韩第三页| 亚洲美女一区二区三区| 国产成人精品高清在线| 国产在线无码一区二区三区| 国产91线观看| 欧美性天天| 国产视频一区二区在线观看| 久久 午夜福利 张柏芝| 丰满人妻被猛烈进入无码| 日本三区视频| 日本国产精品| 精品成人一区二区| 欧美第九页| 日本精品一在线观看视频| 国产国拍精品视频免费看| 国产成本人片免费a∨短片| 91丨九色丨首页在线播放| 国产成人8x视频一区二区| 国产成年女人特黄特色毛片免| 99精品视频在线观看免费播放| 狠狠色丁香婷婷| 欧美区国产区| 在线视频亚洲色图| 高清不卡毛片| 色综合网址| 国产精品一区二区无码免费看片| 激情六月丁香婷婷| 国产高清无码麻豆精品| 欧美a在线| 中文字幕第4页| 一级毛片在线免费看| 亚洲成人手机在线|