林 欣
LIN Xin
(貴州師范大學 數學與計算機科學學院,貴陽 550001)
隨著我國高校網絡信息系統的不斷發展,我國高校信息系統整體水平有了很大的提高,取得了較大的成就。然而,在高校信息化的過程中也碰到了一些新的問題,例如:不同高校之間,同一高校不同的部門之間進行業務協作時,應該以哪個高校或者哪個部門的哪些數據作為業務協作的數據標準;高校在建立門戶系統時如何統一不同高校、不同職能部門間信息發布的格式等問題。
造成這個問題的原因,筆者認為主要有三方面的因素:首先,基礎數據不一致。早期的系統建設過程中,各高校、各行政部門以及各院系只關心內部的事務,很少考慮與外部的協作。因此在數據結構、數據庫的設計上只是滿足了當時內部需要,造成了基礎數據的不一致;其次,信息資源的描述結構不統一。因為以前的系統建設主要是各高校或各行政部門和院系根據自己的需求獨立進行建設,例如:網站上校務的發布格式,辦事指南的格式都是各個行政部門根據自己的需要確定的,因此產生了信息資源描述的不一致問題;最后一個問題就是制度問題,例如:有些高校、院系不愿意與其他高校、院系共享自己的信息資源。
從數據的層面分析能明確知道,這三方面的因素直接導致了在高校與高校之間、高校各個職能部門與院校之間,或者院校與學生之間需要系統互操作的情況下,存在基礎數據需要標準化、文檔需要標準化、信息資源分類和描述需要標準化這三方面的問題。那么我們應該用什么來解決這一系列問題呢?筆者認為應該在網上校園系統中引入元數據的概念。
“Metadata”一詞作為計算機科學領域的專用術語最先出現在美國國家航空與航天局的“Directory Interchange Format”(DIF)手冊中,而后被廣泛應用于地理界、藝術界、博物館界、圖書情報界等。目前,對Metadata存在不同的譯法,主要有“元數據”,“描述數據”,“詮釋資料”等。
元數據最簡單的英文定義是:“data about data”,即元數據是有關數據的數據。這是人們普遍認同的一個定義,也是具有最廣泛外延的一個定義。在元數據的概念應用較廣泛的數據倉庫中,它是指關于數據的數據,用以描述數據倉庫的數據和環境。并可分為兩類:一類是管理元數據(Administrative Metadata),它是對源數據及其內容、數據倉庫主題、數據轉換及各種操作信息的描述。另一類是用戶元數據(User Metadata),它幫助用戶查詢信息、理解信息,了解數據倉庫中的數據和組織。
盡管不同專業領域對元數據的定義有諸多的不同,但其本質是一樣的,通俗的說元數據就是一種有效的信息資源組織和管理的工具,是一種編碼體系。筆者認為用元數據來描述高校信息資源或數據對象,可以使高校與高校之間、高校各個職能部門與院校之間,或者院校與學生之間當需要系統互操作的情況下用戶能夠發現資源,識別資源,評價資源,而且使用元數據可以對相關的信息資源進行選擇、定位和調用,追蹤資源在使用過程中的變化,實現信息資源的整合、有效管理和長期保存。這樣不僅避免了高校的系統與系統之間信息資源描述的不一致導致信息資源出現“信息孤島”,而且可以集成各類復雜繁多的政務信息、提高數據質量。在通常的網上高校系統開發工程中,數據關系缺乏規范、統一的描述,影響系統管理、維護的效率和質量,系統開發周期長。有了元數據,系統開發人員可以合理規劃開發計劃,確定工作難點,對改造和升級等工作進行相應分析,提高系統建設各環節的效率。

圖1 數據存儲元數據
網上高校信息系統功能的實現一般都以高校基礎數據為依據,所以靈活、高效的管理這些數據是我們的基本目標。為此,筆者引入(如圖1所示)數據存儲元數據管理機制。所有與基礎數據相關的元數據都采用面向對象三元組(實體、關系、屬性)方式表示,例如:數據庫表結構存放在一個有序數組中,其中數組中每一個元素描述數據庫表的屬性信息:如各屬性的基本信息,屬性之間的關系,數據庫表之間的關系等。
網上高校系統不僅要管理數據,更主要的是控制數據流程,包括用戶數據流和系統數據流。如果把用戶的操作信息及數據傳遞規則固化在程序中,當用戶的操作或規則發生變化時,變動程序是不可避免的,為此該系統提出業務管理元數據。這里可以把整個組織業務看成事務對象的集合,一類工作看成集合中的一個元素,相當于一個事務對象。針對此類工作的所有操作活動聯合在一起形成了該事務對象的基本功能。
因此可以把整個業務邏輯抽象成一個可任意擴展的樹型結構,它定義用戶可選擇的系統功能、有權操作的數據子集、設定數據子集的操作方式以及每個數據子集的數據項等信息。以信息流轉為例,系統管理員需要控制以下內容:用戶可以操作的數據表(例如:辦文數據表,校務督察數據表),對數據表的控制權限(完全控制,修改,瀏覽),可操作的數據表元組的集合(例如:已經得到領導批示的公文),可以選擇的操作類型(例如:基本操作或自定義操作),可以操作的數據表的屬性(可瀏覽或可編輯),操作的類型(添加、修改、瀏覽及統計等)。為實現信息流轉需要給不同用戶設定相應的操作功能和界面,也就是為用戶提供操作集。其中操作全集是系統的關鍵元數據集,這個元數據集是一個可擴展的樹,而每個元數據元素,也就是樹的各個節點采用可變數組的方式來表示,這樣操作集元數據在各個層次上都是可擴展的,元素之間可以按照業務規則任意組合。
隨著時間的推移,不僅可獲得的信息數量和類型在不斷膨脹,而且信息的領域也更加廣泛。所以,利用其他系統的信息以及向其他系統輸出信息成為系統設計需要考慮的主要問題。無論是輸入還是輸出信息都不是簡單的拷貝過程,多系統之間除了數據定義方式和輸出方式存在很大區別,系統集合也在不斷變化。采用元數據解決多系統之間的交互操作是一種比較靈活方便的方法。元數據可以通過對數據交換中數據對象的內容、質量條件等特征與數據交換行為進行描述與說明,幫助用戶有效地定位、評價、比較、獲取和使用數據對象。其中,對數據對象某一特征的描述,稱為一個元數據項。某一交換數據的所有元數據項構成一個元數據紀錄。數據交換元數據是一個由若干復雜或簡單的元數據項與紀錄組成的集合(如圖2所示)。在數據交換系統中,數據交換元數據主要可以在下幾個方面發揮作用:描述待交換數據對象的內容及完整性規則;描述待交換數據對象的存儲方式及位置;描述待交換數據對象的分割、提取、清理、安全性;描述待交換數據對象的轉換方法及途徑;描述數據交換行為的方式。

圖2 數交換元數據
多媒體信息如音頻、圖像、視頻等需計算機處理的二進制數據,是非結構化的,不能簡單地用數學解析式表示。在網上高校中對多媒體數據的要求越來越多。如網上數據共享;網站的網頁制作;遠程多媒體教學以及多媒體課件制作等。
圖像元數據可以通過媒體對象的特征提取函數生成。原始圖像信息經特征提取函數(圖像預處理器),提取媒體特征后形成獨立媒體;再經后級特征提取函數處理形成媒體依賴,即媒體的產生時間、地點和所有者等形成元數據,圖像元數據通過檢索接口輸出,存儲并供用戶查詢使用。
從實踐運用的角度,對元數據在網上校園中的數據存儲、數據交換和數據管理等方面的作用進行了探討。把元數據的概念引入網上高校,可以使我們現有的網上高校系統具有極高的可操作性、可移植性、可擴展性、可維護性和數據一致性、靈活性。除以上討論的元數據外,筆者認為保證系統安全、智能化統計、音頻、視頻等方面的問題在網上高校中的運用還有待研究探討。
[1]趙慧勤.網絡信息資源組織——元數據[J].情報理論與實踐.2000.6.
[2]元數據及其相關術語[J].情報理論與實踐.2005.5.
[3]莊育飛.Dublin Core∶網絡資源組織與整理的新思路.情報學報[J].2000.2.
[4]李郎達.METADATA初探.情報科學[J].2001(6).
[5]趙志榮, 張曉林.GILS∶ 結構、元數據, 應用.情報科學[J].2000.9.
[6]PublicRecord office.Management[J], appraisal and preservation of electronic Records-Vo11.2nd edition 1999.
[7]PublicRecord office.Management[J], appraisal and preservation of electronic Records-Vo12.2nd edition 1999.
[8]張曉林.元數據開發應用的標準化框架[J].現代圖書情報技術2001.2.
[9]楊治平、馮素梅.多媒體數據庫的元數據存儲與檢索[J].重慶師范學院學報, 2002.3.
[10]Rachna Dhamija rachna, Adrian Perrig DéjàVu.A user study using images for authentication[J].Proceedings of the 9th USENIX Security Symposium, 2005, 9(2)∶ 201-207.
[11]呂波,王延章,王紅梅.數據倉庫元數據的界定與分類[J].信息與控制, 2001, 30(6)∶ 498-501.