999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于多維排列圖譜的國內個性化信息服務研究熱點分析

2011-04-29 00:00:00劉甲學王佳琦
現代情報 2011年3期

[摘要]以CNKI為數據源,借助SPSS 17.0,采用共詞聚類分析法、因子分析法與多維排列分析法,對近十年圖情領域的核心期刊中個性化信息服務文獻進行文獻計量學分析,并繪制多維排列圖譜,進而探索出個性化信息服務兩大維度,即應用維度和技術維度,并直觀展現出個性化信息服務研究熱點。

〔關鍵詞〕個性化信息服務;SPSS;共詞聚類分析;因子分析;多維排列分析

DOI:10.3969/j.issn.1008-0821.2011.03.007

〔中圖分類號〕G203 〔文獻標識碼〕A 〔文章編號〕1008-0821(2011)03-0032-06

Research Hotspot Analysis of Demastic Personalized Information

Service Based on Multi-dimensional Scaling MapLiu Jiaxue Wang Jiaqi

(College of Information Management,Heilongjiang University,Haerbin 150080,China)

〔Abstract〕Using the CNKI database as the data source,drawing support from the SPSS software 17.0,and adopting the methods of co-word clustering analysis,factor analysis and multi-dimensional scaling analysis,the paper attempted to analyze,in the perspective of literature metrology,the papers on personalized information service in corn journals of library and information field in recent ten years.Furthermore,the paper drew the multi-dimensional scaling map,as a conclusion,it explored two-dimensions of personalized information service,such as application dimension and technology dimension,and intuitively reveals the hotspot about personalized information service.

〔Keywords〕personalized information service;SPSS;co-word clustering analysis;factor analysis;multi-dimensional scaling analysis

隨著互聯網的不斷發展和普及,它已滲透到人們工作、生活的各個領域,通過網絡人們能夠不受時空、地域限制地得到快捷、便利、高效的信息服務[1]。然而,隨著信息資源數量的“爆炸性”增長,信息超載、信息迷航等一系列問題接踵而至,這為人們得到快捷、便利、高效的信息服務提供了層層障礙。為了上述狀況能夠真正得到改善,需要引入一種滿足用戶個性化需求且能夠自動調整和組織信息的服務模式,個性化信息服務正是在這種情況下應運而生。因此,個性化信息服務的研究和應用具有十分重要的意義。

筆者以CIKI為數據源,首先利用ROST CM內容分析與文本分析軟件對個性化信息服務文獻的詞頻進行統計,在此基礎上,借助SPSS 17.0進行共詞聚類分析、因子分析等多元統計分析,最終繪制出個性化信息服務可視化多維排列圖譜,以求清晰直觀展現個性化信息服務研究熱點。

1 研究方法與數據來源

1.1 研究方法

本文采用定量分析與定性分析相結合的研究方法,尤其注重文獻計量學分析以及多維排列圖譜的繪制。多維排列圖譜即多維排列分析圖,它借助SPSS 17.0統計分析軟件繪制而成,旨在以可視化的圖像直接展示出某一領域的研究熱點。本文采用的具體研究方法包括共詞聚類分析、因子分析以及多維排列分析。

1.1.1 共詞聚類分析法

共詞分析方法最早在20世紀70年代中后期由法國文獻計量學家提出的,利用文獻集中詞匯對或名詞短語共同出現的情況,來確定該文獻集所代表學科中各主題之間的關系[2]。共詞聚類分析法作為共詞分析法的一種,主要是借助數據挖掘中的聚類算法,將彼此聯系相對緊密的主題聚集起來形成概念相對獨立的團體[3]。在圖情領域,共詞聚類分析法中的“詞”通常被理解為關鍵詞,能夠反映一篇文獻的研究主題,如果兩個關鍵詞在同一篇文獻中出現的次數越多,則說明這兩個關鍵詞所代表的研究主題間的關系越緊密。

1.1.2 因子分析法

因子分析法的概念源于Karl Pearson等人關于智力測驗的統計分析,主要是從研究相關矩陣內部的依賴關系出發,把一些具有錯綜復雜關系的變量歸結為少數幾個綜合因子的一種多變量統計分析方法[4]。因子分析法的優勢在于降低統計量的同時再現變量之間的內在聯系。

1.1.3 多維排列分析法

多維排列試圖通過測定事物或觀測量之間的距離來發現數據結構[3]。運用多維排列分析法,能夠將原始數據結構轉化為一個多維度的空間圖,個體間的相對位置在空間圖中清晰可見。

1.2 數據來源

本文以CNKI為基礎數據源,由于核心期刊的文獻質量比較高,基本上能夠反映出該領域的研究熱點,所以本文參照2008年北大版《中文核心期刊要目總覽》圖情領域(G25,G35)的核心期刊進行檢索,檢索日期界定在2000年6月30日-2010年6月30日,以主題詞為“個性化信息服務”OR“信息個性化服務”進行精確檢索,最終得到有效文獻404篇。

1.2.1 關鍵詞的處理

提取出每篇文獻的關鍵詞,在關鍵詞的處理上,考慮到每位作者的語言和選詞習慣不同,在選取關鍵詞時具有一定的主觀性。因此,在對每條記錄關鍵詞進行歸類之前,首先排除沒有獨立檢索意義且過于寬泛的詞,如“反映”、“研究”、“研究綜述”等,其次對論文的關鍵詞進行歸類處理,采用同級合并歸類和上歸類的策略,即合并同義詞統計結果,將下位關鍵詞的統計結果并入上位關鍵詞,如將“檢索”、“信息搜索”歸為“信息檢索”,最后,詞頻居于前列的關鍵詞特殊對待,單獨列出,如“圖書館”、“數字圖書館”。

1.2.2 詞頻的統計

把處理后的關鍵詞導入文本文檔中,利用ROST CM內容分析與文本分析軟件自動統計各關鍵詞的詞頻,按詞頻的降序排列,最后選擇出現頻次大于5次的關鍵詞作為研究對象。結果如表1:表1 個性化信息服務文獻中的高頻關鍵詞

序號關鍵詞詞頻序號關鍵詞詞頻A1圖書館165A15信息推送14A2個性化信息服務151A16個性化信息10A3個性化服務74A17智能代理10A4數字圖書館68A18個性化定制10A5網絡環境43A19網絡信息服務10A6個性化38A20搜索引擎8A7信息組織28A21資源整合8A8技術26A22個性化推薦7A9服務模式23A23隱私保護7A10數據挖掘22A24信息過濾7A11用戶需求22A25協同過濾6A12數字參考咨詢20A26電子商務6A13模型20A27關聯規則5A14信息檢索18總計—8262 數據分析

2.1 共詞聚類分析

利用EXCEL的數據透視表統計出27個關鍵詞的共現頻次,即統計它們在同一篇文獻中成對出現的次數,形成一個27*27共詞矩陣(見圖1),將共詞矩陣導入SPSS 17.0中,為消除共詞頻次差異的影響,利用Pearson相關系數將其轉化成相似矩陣,即泊松矩陣,進而對其進行聚類分析。聚類分析主要分為兩類,均值聚類和系統聚類。分類數目已經明確的情況下采用均值聚類;在分類數目未知的情況下采用系統聚類。因此,本文對數據進行的是系統聚類分析。在聚類方法上采用Wards method,此方法能夠產生較好的聚類效果,通常作為關鍵詞聚類的首選方法。根據得到的聚類圖,可初步判斷各關鍵詞的關聯程度,越早聚類表明關鍵詞間的相關性越強(見圖2)。

2.2 因子分析

為了便于進一步做多維排列分析,筆者將引入因子分析。通過因子分析,關鍵詞能夠根據其相關性的大小進行分組,使得同組內變量之間的相關性較高,而不同組間變量的相關性較低。最終分析結果得到的因子個數即關鍵詞的分組數。

因子分析過程中,筆者采用主成分法(Principal components)和方差最大的正交旋轉法個特征值,主成分通過自身所解釋的原始變量方差的大小進行重要性排序,在最初的分析結果中,包含了與原始因子數一樣多的成分,即在本文中27個成分對應27個特征值。為了判斷變量與哪個成分(因子)最為相關,使對主成分的解釋變得簡單明了,筆者對代表相關性大小的因子載荷系數矩陣進行正交變換,使系數向0或1的方向極化,這一步驟稱為因子旋轉。因子旋轉方法有很多,這里選擇最常用的方差最大旋轉(Varimax),該方法是一種正交旋轉法,它使每個因子上的具有最高載荷的變量數最小,以此簡化對因子的解釋[6]。在此基礎上,使用碎石檢驗準則確定提取因子數。碎石檢驗準則(SCREE TEST CRITERION)是根據碎石圖的形狀來判斷因子的個數。該圖的形狀像一個山峰,從第1個因子開始曲線迅速下降,然后下降變得平緩,最后變成近似一條直線。由于后面的散點就像山腳下的碎石,舍棄這些“碎石”,不會丟失太多信息,該準則因此而得名[7]。通常情況下,曲線開始變平的前一個點所對應的數值被認為是最后確定的因子數,從圖3中我們可以看出,當累積到第9個因子時,曲線開始接近平滑,那么,它的前一點數值為8,由此可知,提取8個因子最為合理,即將關鍵詞劃分為8組,最為合理。

2.3 多維排列分析

基于上文已經得出的將關鍵詞分為八組的結論,將導入SPSS 17.0的相似矩陣,通過“Analyze→Scale→Multidimensional Scaling”做進一步的多維排列分析,可繪制出如圖4所示的多維排列圖譜。

2.4 結果分析

通過上述關鍵詞在多維排列圖譜中的分布,筆者根據關鍵詞的屬性,探索出個性化信息服務研究的兩大維度,橫軸表示個性化信息服務研究的應用維度,縱軸代表個性化信息服務研究的技術維度。應用維度以最左側表征個性化信息服務技術的關鍵詞“個性化定制”為起點,由技術類關鍵詞向表征應用類的關鍵詞過渡,自左向右,不斷深化。技術維度以關鍵詞“信息組織”為出發點,自底向上,由應用過渡到技術,并向深層次的表征技術的關鍵詞細化,如協同過濾、關聯規則等。筆者結合多維排列圖譜,及上文因子分析得出的結論,在兩大維度框架下,對個性化信

A1圖書館 A2個性化信息服務 A3個性化服務 A4數字圖書館 A5網絡環境 A6個性化 A7信息組織 A8技術 A9服務模式 A10數據挖掘 A11用戶需求

A12數字參考咨詢 A13模型 A14信息檢索 A15信息推送 A16個性化信息 A17智能代理 A18個性化定制 A19網絡信息服務 A20搜索引擎 A21資源整合

A22個性化推薦 A23隱私保護 A24信息過濾 A25協同過濾 A26電子商務 A27關聯規則

圖2 個性化信息服務文獻關鍵詞聚類分析圖圖3 個性化信息服務文獻關鍵詞因子分析碎石圖

息服務的研究熱點及趨勢進行如下具體分析:

(1)第一類是對圖書館的個性化信息服務的研究,由A3個性化服務、A1圖書館、A12數字參考咨詢、A9服務模式、A16個性化信息5個關鍵詞組成。此類關鍵詞分布在多維排列圖譜中第四象限,屬應用維度研究范疇,而關鍵詞圖書館離原點距離最近,說明它是該類研究的核心關鍵詞。近年來,圖書館把實現個性化信息服務作為自身發展的重要方向之一,圖情領域普遍認為提供專門而深入的圖4 個性化信息服務文獻關鍵詞多維排列圖譜

個性化信息服務是圖書館縱向發展的一個契機,傳統的圖書館從開、閉架的閱覽到數字參考咨詢都與個性化的知識交流和信息服務息息相關,進入數字化時代后,全新的信息服務環境為個性化信息服務模式提出了新的挑戰,基于此,圖書館開始思考并拓展信息服務模式以提高自身的競爭力。因而,個性化的服務模式成為圖書館及其數字參考咨詢研究的重要內容。

(2)第二類是對信息組織和資源整合的研究,由A6個性化、A7信息組織、A21資源整合3個關鍵詞組成。此類關鍵詞位于多維排列圖譜的下方,關鍵詞信息組織、資源整合分布在第四象限,從屬性上看是表征個性化信息服務應用的,所以此類關鍵詞是個性化信息服務應用維度的又一研究。隨著信息量的爆炸性的增長,個性化信息服務中的資源整合、信息組織研究已成為焦點,如何進行組織與整合,將有效的信息及時準確地推送到最有需求的用戶面前,成為個性化信息服務進程中一個至關重要的問題。面向個性化服務的信息組織是指在對用戶進行興趣、需求分析的基礎上,為用戶創建主動的、個性化的信息資源與服務的集合[8]。它與傳統的信息組織相比具有更強的實用性,而資源整合同時也是信息組織個性化服務所面臨的基本問題之一,因此,信息組織與資源整合成為個性化信息服務的研究熱點。

(3)第三類是基于用戶需求的建模技術的研究。由A11用戶需求和A13模型兩個關鍵詞構成。從圖4中,我們可以看出,A11和A13兩個關鍵詞分布在第三象限,且位置重合,說明二者屬于技術維度研究范疇且關聯度較高。“以用戶為中心”是個性化信息服務開展過程中的一個重要的理念。既然個性化服務的目標是用戶,對用戶需求的分析、獲取和管理成為個性化信息服務運行的關鍵因素。隨著網絡資源爆炸式的增長,用戶的需求日益復雜多樣化,傳統的服務模式難以適應并滿足用戶日益增長的信息需求。在進行個性化信息服務的探討過程中,越來越多的學者將研究對象聚焦于用戶需求模型。學者們通過“把握用戶的需求信息和興趣偏好,建立用戶需求模型,在整合內外部信息資源的基礎上,進行個性化信息資源的識別與匹配。[9]”用戶需求模型細致地展示了用戶的各種需求特征,為更好的進行個性化信息服務打下了夯實的基礎。因此,基于用戶需求的建模技術成為個性化信息服務的研究熱點。

(4)第四類是網絡信息檢索的個性化信息服務,由關鍵詞A14信息檢索、A20搜索引擎、A19網絡信息服務組成。信息檢索、搜索引擎是表征個性化信息服務技術類的關鍵詞,且此類關鍵詞位于第三象限,說明它們是個性化信息服務技術維度的研究熱點。信息檢索作為個性化信息服務早期的研究方向,其研究熱度并沒有下降。搜索引擎作為網絡信息檢索工具而被人們廣泛使用,由于海量信息的出現,使得傳統的搜索引擎在功能上的表現略顯不足,為了實現滿足用戶個性化需求的目標,網絡信息檢索的個性化信息服務得到關注,而且文獻量逐年上升,成為研究熱點。

(5)第五類是個性化推薦服務研究,由關鍵詞A15信息推送、A18個性化定制、A22個性化推薦、A25協同過濾、A24信息過濾、A17智能代理、A10數據挖掘、A27關聯規則組成。從圖4中,我們可以看出,此類關鍵詞位于第一、二象限,分布范圍較為廣泛。個性化推薦是目前個性化信息服務的重要研究方向,它所涉及的關鍵技術有協同過濾、信息過濾、信息推送、數據挖掘、關聯規則、智能代理等。在對個性化信息服務技術的探討過程中,這些關鍵詞一直是近年來個性化信息服務研究的熱點,因此,就其發展趨勢而言,個性化推薦服務仍然會是個性化信息服務的熱點研究方向。

(6)第六類是數字圖書館的個性化信息服務,由A4數字圖書館、A2個性化信息服務兩個關鍵詞組成。從圖4中的關鍵詞分布,我們可以看出,數字圖書館雖然從屬性上看是表征個性化信息服務應用的關鍵詞,但與表征個性化信息服務技術的關鍵詞空間距離較小,說明它與代表個性化信息服務技術的關鍵詞關系緊密。數字圖書館是在網絡這個大背景環境下應運而生的,其發展自然離不開網絡技術力量的支持。在我國,數字圖書館的研究起步較晚,但其在圖書館學、情報學領域近年來的研究熱度卻不可小視。數字圖書館的根本目標是通過一定模式的系列服務有效支持用戶利用信息解決現實問題和創造知識[10],即通過一系列的服務模式滿足用戶的信息需求,可見,個性化信息服務的出現為數字圖書館實現其根本目標提供了契機,同時,個性化信息服務作為數字圖書館的最佳服務方式之一,日益成為學者的關注焦點及發展趨勢。

(7)第七類是個性化信息服務的隱私保護問題。由關鍵詞A5網絡環境和A23隱私保護構成,分布在第一象限,在兩大維度共同作用的產物,隱私保護得以實現既涉及安全技術力量的支持,又包括相關法律條文及政策的頒布與實施。網絡環境為個性化信息服務提供了更為廣闊的發展空間,同時,也帶來了一些弊端及隱患,如網絡安全、隱私保護等問題的出現。進行個性化信息服務的前提必須了解用戶的個性化需求,這就難免要對用戶行為日志及注冊的個人信息等進行調查和收集。由此,隱私問題就會有所涉及,因而很可能導致用戶對個性化信息服務過程存在不信任感,這將阻礙個性化服務的進一步發展。所以,隱私保護問題一直以來都是個性化信息服務面臨困境的重中之重,關乎用戶隱私的安全技術及政策法規,成為個性化信息服務的研究熱點之一。

(8)第八類是電子商務的個性化信息服務。由關鍵詞A26電子商務、A8技術組成,分布在第一象限。隨著web2.0的出現,電子商務開始進入了人們的視線,其依托網絡環境產生的自身特質,及以用戶為中心的服務理念,預示著它與個性化信息服務技術關系緊密。個性化電子商務平臺的建設、購物搜索引擎的個性化服務研究、電子商務中個性化推薦服務等研究充分體現了電子商務與個性化信息服務技術的融合。但由于電子商務關鍵詞的頻次較低,說明其研究熱度不是很高,但在強大的市場需求的推動下,它必將成為個性化信息服務的未來發展趨勢之一。

3 結 論

本文借助SPSS 17.0統計分析軟件,首先采用共詞聚類分析法初步判斷各關鍵詞的關聯程度、其次運用因子分析法對關鍵詞進行因子分析,通過碎石檢驗準則確定其合理分組數,最后,借助多維排列圖譜,探索出個性化信息服務的兩大維度,即應用維度與技術維度,在這兩大維度框架下,對近十年來個性化信息服務領域研究熱點及趨勢進行了詳細的分析和探討:(1)個性化信息服務的應用維度以網絡環境為依托,與圖書館、數字圖書館、數字參考咨詢及信息資源組織與整合結合較為緊密。(2)個性化信息服務探討的技術維度的熱點問題主要包括個性化推薦技術、信息檢索技術、搜索引擎技術以及基于用戶需求的建模技術。(3)信息推送、智能代理、數據挖掘、信息過濾、協同過濾作為表征個性化信息服務技術的關鍵詞,雖然在本文中,筆者沒有詳細論述,但從詞頻的優勢上,我們能夠看出,它們仍然是個性化信息服務研究的熱點。(4)為用戶提供更高質量的個性化信息服務與對用戶的隱私進行保護,從始至終學者們在這兩點上進行著博弈,期待找到一個平衡點。所以關乎用戶隱私的安全技術及政策法規研究,成為個性化信息服務的研究熱點之一。(5)關于以電子商務為主題的個性化信息服務研究,并沒有成為研究熱點,但在強大的市場需求的推動下,它必將成為個性化信息服務的未來發展趨勢之一。

參考文獻

[1]顏端武,王曰芬.信息獲取與用戶服務[M].北京:科學出版社,2010:214-216.

[2]鐘偉金,李佳.共詞分析法研究(一)——共詞分析的過程與方式[J].情報雜志,2008,(5):70-72.

[3]鐘偉金.共詞聚類分析法的類團實例研究——對腫瘤治療熱點主題的分析[J].中華醫學圖書情報雜志,2008,18(2):48-53.

[4]王蘇斌,鄭海濤,邵謙謙.SPSS統計分析[M].北京:機械工業出版社,2003:400-412.

[5]韓璐,謝俊奇.基于多維尺度分析的土地科學決策支持系統研究現狀分析[J].中國土地科學,2009,(7):37-42.

[6]李婷.虛擬人體的多尺度建模方法研究[D].北京:清華大學,2008:17-24.

[7]郭志剛.社會統計分析方法[M].北京:中國人民大學出版社,1999:87-115.

[8]司徒俊峰,曹樹金.面向個性化服務的信息組織本體模式[J].情報理論與實踐,2009,(11):93-97.

[9]俞曉霞.論數字圖書館個性化信息服務的實現[J].圖書情報工作,2005,(5):30-32,71.

[10]張曉林.數字圖書館機制的范式演變及其挑戰[J].中國圖書館學報,2001,(6):3-8,17.

主站蜘蛛池模板: 免费看av在线网站网址| 国产97区一区二区三区无码| 精品少妇人妻av无码久久| 无码人妻热线精品视频| 国产区免费| 国产成人久视频免费| 特级毛片免费视频| 国产成人调教在线视频| 国产免费网址| 91小视频在线观看免费版高清| 少妇精品久久久一区二区三区| 国产毛片不卡| 最新亚洲人成无码网站欣赏网 | 国产在线精品99一区不卡| 国产久草视频| 成人免费一级片| 伊人久久婷婷五月综合97色| a免费毛片在线播放| 毛片网站免费在线观看| 亚洲人成网站在线观看播放不卡| 国产另类视频| 丁香婷婷综合激情| 91无码人妻精品一区| 国产呦视频免费视频在线观看| 亚洲国产精品美女| 最新国产高清在线| 国产一级在线播放| 大香网伊人久久综合网2020| 国产成人综合在线观看| 女人18毛片一级毛片在线| 日韩成人免费网站| 国产亚洲日韩av在线| 亚洲天堂视频在线观看免费| 国产精品香蕉在线| 久久人人妻人人爽人人卡片av| 高潮毛片免费观看| 欧美在线一级片| 农村乱人伦一区二区| 欧美天天干| 久久国产精品嫖妓| 麻豆精品久久久久久久99蜜桃| 97久久超碰极品视觉盛宴| 精品少妇三级亚洲| 亚洲中文字幕无码爆乳| 欧美性色综合网| 国产高潮视频在线观看| 日本高清视频在线www色| 极品国产在线| 国产chinese男男gay视频网| 丁香婷婷久久| 国产丝袜啪啪| 日韩视频免费| 国产成人喷潮在线观看| 99热6这里只有精品| 91精品啪在线观看国产| 黄色网页在线播放| 国产麻豆精品久久一二三| 久久精品最新免费国产成人| 国产高清在线丝袜精品一区| 91福利免费视频| 99久久精品视香蕉蕉| 亚洲成人一区二区| 久久香蕉欧美精品| 精品黑人一区二区三区| a级毛片免费看| 国产理论精品| 国产91九色在线播放| 久久久久久国产精品mv| 久久99国产精品成人欧美| 亚洲成网站| 波多野结衣视频网站| 欧美成人午夜影院| 国产精品亚洲а∨天堂免下载| 亚洲国语自产一区第二页| 欧美翘臀一区二区三区| 国产亚洲欧美在线视频| 成人亚洲视频| 国产成人超碰无码| 欧美视频二区| a毛片基地免费大全| 国产玖玖玖精品视频| 欧洲成人在线观看|