李雁鳴
摘 要:文獻計量作為量化情報信息的重要手段,在科研評價、館藏核心測定、前沿發展方面發揮著重要作用。本文從文獻計量的特性出發,研究了數據可視化技術、語義處理技術、文獻計量與信息檢索整合三個方面的研究技術展望,探討了文獻計量在我國現階段圖書情報領域中核心期刊測定、熱點研究、科學評價、館藏建設四個方面的應用,為我國提高圖書情報工作質量提供了很多幫助。
關鍵詞:量化;文獻計量;應用
一、文獻計量研究背景與研究意義
文獻計量由文獻學發展而來,從最初比較出版物、統計書目到采用統計學計算方法、整合文獻事實研究及計量表征,發展到涵蓋情報信息分布層次、數量變化、規律測試的指導、探討科研熱點、結構、特征的學科。我國文獻計量起步于上世紀六十年代,發展于八十年代后期,經過數十年發展,基本形成了符合我國科研環境的文獻計量理論、方法、實踐經驗的知識體系,為我國情報信息處理提供了有力支撐,成為圖書情報與科學評價領域中一個重要的分支學科。
文獻計量通過探索與完善表征詞頻分布或文獻分散規律的實踐方法,實現數學、統計、文獻學的有機結合,將文獻評價、出版物確定、文獻利用率等機能日益完善,為實現圖書情報的科學管理提供了有利條件。文獻計量對實現情報網絡建設、情報處理效率、文獻服務利弊等方面的提升產生深遠影響。但隨著近年來圖書情報領域不斷發展,尤其當前 “大數據”、云計算、人工智能成為研究熱點,呈現的文獻數量以指數型增長,文獻系統固有的不確定因素日益凸顯,造成我國現階段圖書情報工作仍存在宏觀定律依賴數學統計,微觀依賴同行評價的舊弊,影響到學科評價的客觀性。在此種情形下,如何正確地評價分析文獻計量在圖書情報領域的應用,充分發揮文獻計量的優勢,以量化指標全面評價某領域科研效率、研究能力、挖掘深度,實現數學理論與方法運用相結合,以定性過渡到定量,以科學方法探尋情報信息本質,從而提升我國圖書情報信息分析質量。
二、文獻計量在圖書情報特性研究
當前,我國文獻計量學研究范圍已涉及社會網絡映射、數據采集分析、標準制定與研究以及智庫機構量化信息、引文量化分析等,研究方法中可視化、數據挖掘技術運用廣泛,文獻計量凸顯技術與定量的實現趨勢,其在圖書情報領域體現以下特點。
1.指示目標的明確性
文獻計量的指示目標必須遵循互斥、排他原則,即構建指示目標的明確性,作為文獻計量指示的基礎,明確性必須根植于情報信息內容與分析趨勢,此要求包含以下方面:(1)科學指示,即指標在主題、內涵、容量、時間、計算單位、方法有明確的定義與要求,排除可能引發歧義的概念,以期減少收集數據的偏差、誤差;(2)可測量操作,文獻計量認為是一種量化方法,具備工具化、模型化的數學特點,因此其指標的設定前提必須是直接度量的、滿足一定條件的、排除可能引發計算方法偏離的值域或閥值;(3)評價導向性,指示目標的學科評價必須具備正確的、同方向、持續性的引導與鼓勵,計量不是為“文獻打分”,而是歸納文獻的學科發展,明確學科的導向功能,體現絕對的文獻價值。
2.評價的結構層次性
學科評價是文獻計量的重要功能,智庫機構往往通過學科評價確定該信息的價值導向,而學科評價具備明確指向性的特點。組織作為要素基礎,合理組織并建立評價體系模型至關重要,其關鍵在于模型結構的設計,對結構繼續分解定義,賦予分層層數、各層定義和組合因素、層遞關系明確的意義與內容。優秀的指標評價結構體系必須具備以下特點:(1)層次鮮明,即評價分層分析,因層分析,按層分析,既可以保證評價的嚴謹又能夠保證評價目標及時更新;(2)主題一致性,即整體評價的指標與目標統一,層次目標與指標一致;(3)層次數量適度,即滿足指標體系的及時創新及完善,層次銜接緊湊,分析內容緊密契合,易量化操作;(4)目標完備,即體系結構協調、齊整,評價目標完整、全面。
3.計量閥值的選擇性
文獻計量過程所設計、選擇的單一指標可能會出現不符合指標原則的情況,出現評價指標的互相矛盾、相互掣肘、交叉、因果等不恰當關系,這種不確定關系給圖書情報工作者造成干擾,嚴重的可能會出現重大決策失誤。因此明確文獻計量的指示目標必須設定一定的閥值、參數來進行計量選擇。
計量閾值是指量化指標中數量關系、時間參數的設定值,即可理解為互斥條件。而科學選擇閾值應綜合考慮學科評價機理、內涵因素、特點屬性等方面,學科代表性是當前計量閥值設定的基本思想。閥值設定思路包括:(1)以概念為設定閥值,即概念自身定義所隱藏、表征的數量、時間參數,如“年份” “關鍵詞”;(2)以參考定理原理為設定閥值。即“影響因子”“期刊比重”所代表的學科核心定義選擇,如“ISTP”“ESI”;(3)以隨機區間、范圍為設定閥值,即評價的“置信區間”可以涵蓋足夠的文獻,如“某年份、某國”、前“n%”等區間參數。
三、文獻計量主要研究技術與發展趨勢
1.數據可視化技術
數據可視化技術是文獻計量過程重要的實現工具,通過文獻計量的引文方法、內容分析法、元分析法相融合的途徑,實現了計量數據的深度挖掘。根植于數據挖掘、文本分解的分析軟件在開發之初就將計量可視化思想進一步表述,如基于語義計算的Autonomy 軟件,將概念與語義關聯實現對信息的自動理解,自動篩選聚類信息及超鏈接,其核心IDOL(智能信息操作層),能夠挖掘非結構數據,實現數據積累。可視化分析看似重點在于利于交互的界面建立,其實核心在于其中的分析手段、數據梳理方法,及其相應的計量理論。可視化技術幫助用戶從龐大的非結構數據中抽脫出來,分離復雜的數據關系,理解推理結果及明確策略走向。應當強調的是可視化技術與信息可視化有所區別,信息可視化僅僅是實現計算機在網絡環境下自動生成信息交互表現形式的開發、運用,缺少了可視化分析知識發現、梳理、甄別的過程,而可視化技術更側重自動分析方法及算法研究。只有可視化技術選擇與恰當信息自動化相結合、相輔助,情報信息的推送才能更好地完成用戶決策。
2.語義處理技術
語義處理技術主要整合信息評價提取、自然語言(NLP)處理建模、AI應用、數據庫(DT)等智能處理方法,其主要表現為數據表征與涵義提取為機器語言,利用計算機對語言結構進行分析,使得機器能夠識別、理解語言并能夠精確搜索、準確定義。語言處理技術向機器理解數據語義、完善語義技術應用范疇、完成結構化的語義數據采集分析的方向發展,語義處理技術成為當前語言處理技術難點,針對現有情報研究對象(核心期刊、專利、專著等文獻)計量,雖已現存較為成熟的分析軟件與工具,可以類聚關聯鏈接,卻仍舊缺少深層次語義支撐,仍需要耗費較多人力資源對設定進行評價,基于語義處理技術研究支持工具與技術還有提升的空間。
3.基于大數據背景下的發展態勢
大數據技術的蓬勃發展,打破了情報學信息檢索與文獻計量兩大分支的鴻溝,實現了兩者的并行發展,信息檢索中的信息查詢技術智能化程度,“關鍵詞”自動化提取能力有著顯著提高,是進一步彌補文獻計量中檢索時間過長缺陷的重要補充手段。信息檢索能夠實現文獻計量全過程的學術信息交互、使用,涵蓋用戶行為中的瀏覽記錄、下載鏈接、期刊收錄、科研評價、學術引用等方面,實現全時期、全空間的計量。大數據背景下,信息檢索根植于文獻計量,通過信息檢索能夠保存文獻計量的樣本,自動為文獻計量提取樣本,形成文獻圖譜,促使文獻計量向網絡計算發展,從而形成指標閥值基于個性化檢索、精確推薦的文獻計量指標體系。
四、現階段文獻計量在我國圖書情報領域的應用
1.在學科核心期刊測定方面的應用
核心期刊代表著某學科科技前沿、研究前站,是該學科專業情報信息量最豐富、質量最高的主要刊物,是文獻情報最重要的來源。文獻計量在學科核心期刊“量化”“測定”方面應用出現較早,影響較為廣泛,理論較為成熟,期刊測定是文獻計量工具化直接的應用。實踐方面,圖書情報單位建立本機構館藏核心、研究人員科學獲得高質量密度情報源、論文撰寫參閱專業期刊文獻等文獻引用操作,都離不開核心期刊科學、合理、恰當地測定與評價。文獻計量為核心期刊測定形成一種普遍、廣泛的評價體系,從早期簡單考慮單因素的百分比法、累計法,到結合論文引用率、利用率的文摘法、引文法,再到具體問題數據處理的精確計算法,如權重目標法、“無量綱灰色關聯法”。例如,“無量綱灰色關聯法”將“引文量”“摘要詞頻”“流通數量”進行無量綱化,通過灰色關聯系數ξ(Xi)構建灰色關聯模型,比較研究對象與各影響因素的因子值貼近度,由此貼近度獲得影響因子與待識別對象的關聯度大小,從而將關聯度絕對值作為核心期刊的測定值,我們通過絕對值大小來測定該期刊的質量是否滿足評價要求。
2.在熱點研究與科技前沿方面的應用
文獻計量的基礎來源于文獻事實研究,文獻研究古老而生命力頑強,往往帶來新思想、新技術的萌芽,這種萌芽不僅能夠促進學科的正循環發展,更能夠進一步演示學科領域的發展方向。尤其近年來,數據庫技術的應用,文獻數量得到極大豐富,文獻目錄、引文歸集的統計分析方法向計量學方向完善,計量分析在某學科熱點確認、學科研究發展、學科預測等方面得到有效運用。目前,文獻計量對學科動態理論、文獻產出率與現階段成果、發展變化與聯系、詞頻變化與科技發展變化關系等進行切實可行、靈活多樣的事實研究,其中包括了對該學科范圍內論文、專著數量、作者分布概型、期刊組成、關鍵詞頻率、時空參數等全方位、多角度分析,對學科研究現狀及發展趨勢進行客觀評價。如我國數字圖書館核心館藏數據庫建立研究的論著中,研究者主要利用“SCI”“JCR”等工具,運用“引文”間接分析法,通過引文量化頻次、數量、刊物來源,由“引文量分布”“引文篇數分布”獲得引文的集中離散規律,研究該主題文獻量化規律及客戶需求規律,從而為數字化圖書館核心館藏庫建立提供一定的參考價值。
3.在科研評價的應用
我國定性評價方式長期存在于學科研究過程中,其中同行評議的方式固然有著專業、權威、隱匿的優勢,但主觀性、保守性同樣存在,不利于科研能力的客觀評估。而文獻是學科研發的事實依據、固有成果、過程體現,基于文獻計量相關理論的“定量”分析,是將文獻產出“數量”“引文頻次”數量作為科研評價的量化標準,將作者文獻作為科研產能,文獻引用頻次作為科研質量,在一定范圍內提供科研評價參考。隨著影響因子與混合量化指標理念的提出與完善,文獻計量由單一指標,向復合計算演進,通過指數的量來預測、輔助同行評價,由作者核心論文作品集進行科研能力評估,從而建立起完整的科研評價體系。在科研評價過程中,把文獻作為結構性資源,將其基于一般統計、回歸計算等數學方法,納入計量系統工程系統,糾正單一指標所帶來的評價偏差,把科研團隊、學術期刊績效形成適用性報告,客觀的把期刊影響因子、引文、h指數有機結合起來,從而形成科學地科研評價結果。
4.在圖書館藏建設中的應用
文獻計量在我國圖書情報的實踐還體現在圖書情報科學分析管理方面,并涉及到圖書科學管理系統的建立,如圖書流量、圖書選訂、館藏定量、流通分析、用戶評價等多個方面,而且館購圖書文獻質量也影響本機構圖書情報資源建設與發展。圖書館在采購文獻時,可以使用文獻計量中的“引文”法對文獻收集、期刊訂閱、館藏核心進行確認,即通過學科期刊中所內含的文獻“引用量”“衰退周期率”進行分析,確定圖書館文獻資源管理內容。國內眾多高校選擇本校師生論文為研究樣本,統計近年來本校師生發表的論文中引用的參考文獻,并結合本校現階段館藏建設,采用“一次引文法”,以期獲得基于本校用戶行為的圖書情報信息,促進館藏更好的建設。館藏建設在核心期刊計量方面,明確文獻知識累積性、發展性、衰老性,推送給用戶的信息必須是正確的、完整的、匹配的,從而構建基于“數據庫資源”匹配的個性化推送模型,進而構建基于文獻計量的“被引分析”“詞頻類聚”“h指數”的架構模型。同時在情報信息整合方面,圖書館要繼續關注強化詞頻與自動化標注技術研究,完善定量評價與檢索體系,同時借助大數據、云服務、數字圖書館聯盟中海量的數據進行文獻新整合,全面開展學科方向趨勢與科研決策信息服務,深挖用戶行為信息數據,推廣科學的文獻服務管理,謀求當前圖書館創新轉型。
五、總結
我國文獻計量學已經積累了相當多的理論與實踐經驗,文學計量相關應用在圖書情報科學管理方面取得很大的進展,對情報服務實際工作、各圖書情報機構信息處理發揮了舉足輕重的作用。但是我們應該看到現階段文獻計量中重要的理論指導、重要計量可視化軟件大多為西方國家創建,這就要求我們從國內實際出發,腳踏實地研究文獻計量學原理,進一步提升我國現階段文獻計量水平,從而做好新時期圖書情報學應用與管理
工作。
參考文獻:
[1]朱 亮,孟憲學.文獻計量法與內容分析法比較研究[J].圖書館工作與研究,2013
[2]董 琳.使用文獻計量法開展學科研究[J].情報雜志,2013
[3]陳廉芳.高校圖書館文獻計量類型梳理與融合策略研究[J]. 圖書館工作與研究,2019
[4]王節祥,蔡 寧.平臺研究的流派、趨勢與理論框架———基于文獻計量和內容分析方法的詮釋[J].商業經濟與管理,2018
(作者單位:棗莊學院)