劉爽
(北京林業大學 北京 100083)
電子政務是國家信息化發展的重點。隨著電子政務的發展,政府信息服務被提升到新的更重要的高度。目前,大多數政府機構都有自己的網站,并在此基礎上向用戶提供政務信息及服務,然而,大多數電子政務網站提供的都是具有普適性的信息服務,缺乏特色和針對性,無法滿足用戶多樣化、差別化的信息需求。開展電子政務個性化信息服務的需求日益增加。
知識發現是20世紀80年代興起的交叉學科。Fayyad等人對知識發現給出了如下定義:指從數據庫中獲取正確、新穎、有潛在應用價值和最終可理解的模式的非平凡過程。知識發現包括三個關鍵步驟:數據準備、數據挖掘及結果表達和解釋。1、數據準備,又包括3個子過程:數據集成、數據選擇和數據預處理。將多文件或多數據庫運行環境中的數據進行合并處理,解決語義模糊性,處理數據中的遺漏,清洗臟數據,縮小數據處理范圍,提高數據挖掘的質量;2、數據挖掘,選擇數據挖掘算法,根據選定的數據挖掘算法對經過處理后的數據進行模式提取;3、結果表達和解釋。運用可視化方式對模式進行表示,形成用戶可理解的知識,并通過興趣度評價,確定對用戶有用的知識,存儲形成可更新的知識庫。
個性化信息服務能夠滿足用戶個性化的需求,是網絡環境下信息服務向縱深發展的結果,也是信息服務發展的主流模式。
個性化信息服務是以符合用戶興趣、身份和滿足用戶特定需求的信息形式為其提供具有針對性的服務。個性化信息服務包含兩層次的含義:個性化信息。用戶根據自身興趣愛好和需求定制的、反應個體特征的信息;個性化服務。信息提供者針對用戶個性和特點選擇甚至預測出最重要的信息和服務并主動傳遞給用戶,能動態調整服務內容以適應用戶需求的變化。
個性化信息服務有三方面的內容:服務時空個性化、服務方式個性化和服務內容個性化。動態的調整、選擇和組合信息資源以適應用戶需求的變化,并且提供能夠使用戶直接解決問題的知識性信息。
隨著信息技術的快速發展和社會信息化程度不斷提高,人們面臨的信息環境發生了很大變化,利用信息的方式方法出現了許多新特點,決定了電子政務服務對象的個性化區別,這就需要電子政務針對具體服務對象開展個性化特征化服務,這是電子政務發展的必然趨勢。
電子政務個性化信息服務就是在電子政務信息服務中,針對信息用戶的特定需求,以合適的方式,主動向用戶提供經過集成的相對完整的信息組合或知識組合。
傳統的電子政務以政府為中心,政府在向公眾提供信息時往往是面向大眾的具有一定的普適性。而在當今網絡和信息環境下,人們不再滿足于單純上網瀏覽信息,需求呈現出多樣化和復雜化特點。傳統電子政務沒有更好的考慮用戶需求的復雜性與差異性,更沒有考慮到用戶的深層需求和潛在需求。要解決這種信息服務需求與供給不匹配問題,就要求電子政務以用戶需求為中心,根據用戶的個性、偏好和需求變化,動態、主動地向用戶提供滿足其個性化需求的信息組合,并引導其使用這些信息,創造新價值。
由此,知識發現在電子政務個性化信息服務應用的目的在于全面、深入、準確的識別用戶需求,采用特定方式、主動提供有針對性的電子政務服務,實現電子政務從以政務為中心向以用戶為中心的根本轉變,有效提高電子政務信息服務的質量和效率。
用戶個性化信息的知識發現是電子政務個性化信息服務的核心和基礎。電子政務用戶個性化信息的知識發現過程包括數據準備與預處理、數據挖掘、模式表示與評價三個步驟。
電子政務用戶個性化信息來源主要包括兩方面:一是用戶在電子政務網站注冊的個人信息,這部分信息存儲于電子政務系統的數據庫;二是用戶在電子政務系統中的各種行為信息,如用戶訪問、瀏覽網頁記錄、服務請求記錄、信息檢索記錄等,這部分信息利用網絡日志、用戶cookie進行提取和收集。用戶個性化信息從不同方面反映用戶偏好、特征、習慣等,對其進行跟蹤、記錄和處理是電子政務用戶個性化信息知識發現的基礎。
預處理是在數據挖掘之前,對所收集的數據進行必要的操作,主要利用算法進行數據凈化。并不是所有的用戶行為記錄對知識發現都是有用的,因此有必要用數據凈化來去除冗余信息。
運用數據挖掘手段分析用戶數據,有針對性的提供用戶需要的信息服務。可應用于電子政務個性化信息服務的數據挖掘方法主要有以下幾種:
1.分類與聚類分析。數據分類的目標是通過分析數據集,構造分類模型,該模型能把數據庫中的數據記錄映射到給定的類別,從而可以用于數據預測。而當要分析的數據缺乏必要的描述信息,或者根本就無法組織成任何分類模式時,利用聚類函數把一組個體按照相似性歸成若干類,使同一群組的數據盡量相似,不同群組的數據差別盡可能大。
電子政務系統通過分析用戶個人信息、使用行為等個性特征進行用戶分類和聚類,形成不同的用戶細分群體,為電子政務個性化信息服務實施提供可靠依據。
2.關聯和相關性分析。指發現大規模數據集之間的關聯或相關關系,從某一數據對象信息推斷另一數據對象信息,尋找出重復出現概率高的知識模式。
在電子政務個性化信息服務過程中,通過用戶經常使用的服務類別推出其信息服務需求,從而主動為用戶提供其可能需要的電子政務服務,并將同質服務推薦給同類型用戶。
3.順序發現和時間序列分析。順序發現指確定數據組中的順序模式,即發現一些項跟隨另一個項。例如可以根據用戶的身份推出用戶可能需要的電子政務信息服務項目。
時間序列分析的任務是發現屬性值的發展趨勢。如可以通過分析用戶操作的周期性特征,預測用戶行為,從而在適當時間提供適當的電子政務服務,提高信息服務質量。
在對用戶個性化信息進行挖掘之后,運用可視化技術識別所發現的各種模式,使其對用戶可視,將模式轉化為知識,并根據興趣度、支持度進行評價,形成用戶信息知識庫或用戶信息模型,以支持各種個性化應用。
知識發現在電子政務個性化信息服務中的典型應用主要有個性化界面定制、個性化信息推送服務、個性化信息推薦服務和個性化信息檢索服務。基于知識發現的電子政務個性化信息服務模式如圖1所示。
個性化界面指用戶根據自身偏好自行進行界面結構的設計布局,如頁面中包括哪些模塊或服務,各模塊的布局方式,圖像、菜單等的位置設置,界面色彩設置等。是一種較為簡單和直接的電子政務個性化信息服務形式。

圖1 電子政務個性化信息服務模式
信息推送是電子政務個性化信息服務的又一應用。推送技術是目前個性化信息服務中應用較多的一種智能化信息代理技術。它根據用戶定義的準則,自動搜集用戶最感興趣的信息,并適時推送給用戶,使用戶不必每次訪問固定的網站就可以獲得由網站發布的最新信息。提高了用戶獲取信息的效率。用戶在電子政務系統中設置個人定制信息,電子政務系統根據定制關鍵詞自動提取相關內容,定期將更新的內容以電子郵件或頻道形式推送給用戶。推送服務打破了傳統的信息獲取方式,減少了用戶上網搜索的工作量,將個性化的信息直接送給用戶,是電子政務主動提供個性化信息服務的重要手段。
個性化信息推薦是指通過對用戶信息的過濾和挖掘,了解用戶的需求和興趣,實時、個性化的為用戶推薦相關信息和服務。在電子政務中即是為不同用戶推薦不同的政務信息和服務。與推送服務不同的是,推薦服務不以用戶提交定制信息為前提,而是基于通過知識發現得出的用戶個性化信息需求。用戶不一定要提交定制信息,系統借助知識發現技術自動為用戶提供其可能需要的信息和服務。
個性化信息檢索是指能為具有不同信息需求的用戶提供個性化檢索結果的技術,即對不同用戶提交的同一查詢詞語也能按照不同的用戶需求而生成不同的檢索結果。個性化信息檢索有助于解決目前的搜索引擎系統中存在的檢索準確率低、結果冗余嚴重、信息獲取成本高等問題。運用知識發現技術,跟蹤記錄用戶檢索行為,挖掘用戶偏好和特征信息,為用戶提供個性化的信息檢索服務。
隨著網絡環境和信息技術的不斷發展,用戶特定信息需求與海量信息之間的矛盾日益突出,只有個性化的信息服務方式才能解決這一矛盾。電子政務個性化信息服務是電子政務的主要發展趨勢之一。將知識發現技術應用于用戶個性化信息的獲取,為電子政務開展個性化信息服務提供依據。但目前還存在一些問題,例如如何動態捕捉用戶需求的變化以及如何處理基于知識發現的電子政務系統的復雜性與用戶易用性之間的關系,這都是今后研究的重要方向。
[1]史海燕.基于知識發現的數字圖書館個性化信息服務研究.圖書館學研究,2010(19):36-43
[2]董慧.個性化信息服務關鍵技術研究,2009年信息化與信息資源管理學術研討會論文集:176-182
[3]杜春光.個性化信息服務的模式研究及策略分析.國家圖書館學刊,2005(02):63-66
[4]胡昌平.個性化服務中的信息資源重組與整合平臺構建.情報科學,2006(02):161-165
[5]段堯清.個性化電子政務信息服務模式.情報雜志,2007(06):9-14
[6]李菲.基于數據挖掘的電子政務個性化推薦服務框架研究.商業時代,2010(25):47-48
[7]周楊姊.基于知識發現的數字圖書館個性化信息服務.中國成人教育,2010(17):61-62
[8]鄧立恒.基于網絡的個性化信息服務研究.科技情報開發與經濟,2009(07):17-18
[9]李樹青.個性化信息檢索技術綜述.情報理論與實踐,2009(05):107-113