劉巖超
(東北大學圖書館,遼寧 沈陽 110819)
將“信息熵”應用于圖書分類決策(編目)之中,主要涉及兩部分工作原理,即“用戶的注意力轉化”與“信息熵在圖書分類中的表現形式”。
當今社會,最有價值的應屬用戶的注意力,而不再是信息。圖書館的用戶應主要針對圖書借閱者,沒有借閱者,圖書館也就沒有存在的必要。編目工作是圖書館工作的核心部分。筆者認為,圖書館應將借閱者的“注意力”納入到編目工作中,正所謂應“讀者”之所需,吸引“讀者”。
用戶(借閱者)對圖書的信息需求分為顯性需求和隱性需求,這就要求圖書館不僅要滿足借閱者的顯性需求,還要滿足其隱性需求。除了在采購圖書方面酌情處理之外,圖書的編目工作也起著非常重要的作用,而后者為筆者所討論的重點。

圖1 用戶需求
從圖1可以看出,用戶往往出于某種目的,需要借閱某一門類的圖書。在這里暫且認為用戶出于兩種目的(即用二維坐標系來詮釋:主要目的與輔助目的分別作為坐標軸)。隨著外在條件(即圖書館所能提供的圖書數量和種類)與自身需求的不斷變化,如果能夠借閱成功,那么最終將達到某一借閱點B,類似于數學中所提出的“最大公約數”或“交集”,即能夠借閱到所需圖書。圖中OB過程針對的是整個借閱圖書過程中用戶需求的實現。其中,實線部分為用戶的顯性需求,虛線部分為用戶的隱性需求。
用戶的需求往往通過其注意力鎖定的目標來實現。而圖書館所面對的讀者眾多,隨時隨地地逐一訪問并采購是不可能實現的,只能通過初級調查及圖書館各個部門的工作人員協調工作,才能最大限度地滿足用戶需求。

圖2的主要目的是將用戶的注意力與圖書館工作人員的注意力加以轉化,從而最大程度地滿足用戶的借閱需求。在整個轉化過程中,為更加貼近借閱者,圖書館在落實實際工作時,可允許部分有代表性的用戶參與到圖書館的采購和編目之中。那么,在最大限度轉化之后,可以以圖書館工作人員的注意力圖來代替用戶需求圖。

由圖3可見,暫且由某兩種注意力來決定圖書的采購與編目(分別定義為主要注意力與輔助注意力)。那么,OD過程即為一本圖書從決定采購方向起,到真正滿足讀者需求條件的整個過程。實線部分為圖書館員的顯性注意力,虛線部分為其隱性注意力。其中OC為經過初步調查后所決定的圖書購買方向(即滿足最基本的用戶需求,對應圖1的OA段),為圖書采購工作。而CD為圖書采購后的編目過程,在CD過程中,CD實為傳統的編目方法,CD虛是在傳統編目的基礎上,引入信息熵的編目方法。那么D即為在兩種分類方法的共同作用下,真正滿足讀者借閱條件的圖書需求點。
圖書館編目工作的目的是對文獻資源進行分類,編制目錄,建立館藏目錄體系,這就要求在編目過程中對文獻資源(以圖書資源為例)按照一定標準進行分類。在傳統編目中,所提到的標準就是以《中圖法》或《科圖法》的最新更新版本為主要參考準則,采用MARC元數據、DC元數據,并通過各種編目軟件給圖書以分類編號(貼上標簽),并且登記記錄(現在是錄入計算機數據庫)。有的圖書館還實施了一種更加科學的圖書分類方法,例如南京金陵圖書館采用“雙組類號法”,即分類目錄要求細分,以提高檢索效率;分類排架要求粗分,以提高文獻提取和歸架的效率。除了以上編目方法外,國外有些圖書館還采用《數學主題分類法》,甚至考慮到編目業務外包。而以上所提及的幾種分類方法,雖以學科分類和邏輯劃分為標準,但都有一個共同的特點,即在每一種分類方法加以應用時,都存在一個統一的聚類中心,這個聚類中心由分類標準的產生而產生,使得傳統分類方法限制在單一的標準之中,導致分類的局限性或差強人意。除此之外,由于參見類目較少以及在編目過程中編目工作人員無意中將個人的主觀判斷混入分類之中,難免就會出現給類不細、不準,主題詞欠佳等問題。即使是“雙組類號法”,其優點的體現也是在傳統分類方法的基礎上引入《簡本》作為第二維標準,即引入兩套同時運行的分類準則,貴在以館員便利起見,而并非使傳統分類方法得以完善,其第二套標準主要是為圖書排架服務,不再單單針對圖書內容本身,那么,借閱者的切身利益就沒有得到實質性的提高。
筆者提倡將信息熵分類法引入分類決策中,其主要目的在于對傳統分類方法加以補充和完善。它仍以級目細分為準則卻不采用傳統分類法中“從總到分、從寬到窄”的樹狀結構,力求使圖書館在圖書分類工作上達到精、準、細的標準。
2.2.1 信息熵的概念與演化
熵是熱力學第二定律中關于熱量不可逆轉換規律的概念,是表征系統由于其內部個體因子隨機運動所造成的無序性及其程度的度量。根據熱力學第二定律,在孤立系統中,熵總是趨于增大,這就是著名的熵定律。熵定律也可進一步理解為孤立系統內部總是從有序狀態自發地變為無序狀態,最后不可挽回地朝著最為混亂無序的狀態趨近。而在圖書的編目工作中,仍然存在熵的問題,在這里我們精確地稱之為“信息熵”。信息熵值的增大便意味著資源的浪費,那么,編目工作者同樣可以利用“負熵”來阻尼熵的增加,使圖書分類系統得到有序化發展。具體落實到實際工作中,即為圖書主題詞概括的全面性與精準性。
2.2.2 信息熵分類法的具體應用
文獻信息在整個圖書館大系統中,由于受文獻產生的不確定性、類型的多樣性、質量的不定性、內容的重復性和時效性等因素的影響,將使整個圖書館的圖書信息大系統處于混亂無序的無組織狀態,我們把這種文獻信息的無序和混亂程度稱之為文獻信息熵,它是對文獻信息無序程度的量度。如果在編目工作中,這種熵不斷增大,即僅僅完成傳統的編目任務,而不考慮讀者的想法,對一些必要的圖書信息不予理睬,便會使圖書中一些必要的主題詞最終在借閱之前就已荒廢,讀者將不能依照自己的想法而借到理想的圖書,只能硬性地將“人”的思想向圖書館刻板的分類標準靠攏,這便違背了圖書館為讀者服務的理念,反而變成“讀者為了借書而只能迎合圖書館的圖書分類標準”。那么,為了避免以上現象,編目工作者除了在書首或書尾查找CPI以及以《中圖法》或《科圖法》為準則之外,還應對每一本圖書主題詞的概括更加全面和準確。為了開展這項工作,需要考慮兩項工作重點:首先,一本圖書的主題詞可以由一個或一個以上的圖書編目人員來概括,并選擇性地取其詞語概括的“并集”,當然,其中最好也將同義詞錄入系統之中,那么,這便是一個搜集信息和整合信息的過程。其次,針對每一本圖書的內容,必要時可對目錄進行詞語性概括并最終取其“并集”,即相應地擴大借閱者的詞語檢索范圍。以上兩部分工作內容用熵的原理進行分析,就是對圖書的信息系統進行做功。這樣,不僅能使得類目更加細分,還能修改CPI中由于印刷不規范導致的主題詞提煉不精確。最后,將符合規定的圖書信息按照某種邏輯和格式輸入到計算機系統中,使之成為一個信息庫,當讀者在網絡上查找借閱時,輸入圖書的需求性主題詞,即使是專業性比較強的“冷門”詞匯,也將得到人性化的合理匹配,并最終借閱到含有相關知識點的圖書,而這個過程并不是單單的“人機對話”,而是借閱者與編目工作者之間真正的“窗口式”人與人的交流。而此交流過程并不以任何形式保存或標記,即顯即消,隱含在傳統分類法的框架之下。那么,以上所歸納的主要工作過程,均歸納為“負熵”的工作內容,即將圖書中必要的主題詞加以利用,來阻尼編目工作中由于圖書信息遺漏所導致的熵的增加,最終避免讀者流失,實現“每書必有讀者”和“每人必有書借”的雙重目的。
傳統的圖書分類法,是以類目的等級做結構,以科學窗為分類基礎,反映客觀現象發生和發展的過程,并承擔著傳遞文獻信息的基本職能。當信息熵被引入圖書分類決策中后,在傳統分類的形式下,起到了更加貼近讀者的作用,從而更加方便讀者在圖書館網絡上查找并借閱。用一個不夠恰當的比喻,傳統分類法所表現出的索書號相當于一個人的居住地址,而信息熵分類法的出現,使得這個人的性格在公眾面前得以顯現。大多數讀者對索書號僅僅是數字上的概念,他們往往需要用更加生動形象的語言對圖書加以描述,這就是信息熵分類法在圖書分類中對詞語歸納功能的實現。例如醫學類圖書要求細分類目,以《急癥骨科學》為例,將其分類號定義在R680.597,已經滿足專業性圖書類目在5~6級的標準,當信息熵分類法引入之后,分類的級目將更加詳細,也能使模糊、邊緣、交叉學科圖書的分類更加容易。但是,由于目前還沒有一個統一規范的標準來對此類方法加以標志化(即以數字或字母等加以標示),其分類號只能以隱性形式加以表現,具體來說就是以某種函數的形式來從事“幕后”工作。從而實現了在便于讀者查閱圖書的基礎上,仍不失以傳統分類方法加以表現(讀者所借閱圖書的索書號是不變的)的目的。那么即使由于《中圖法》或《科圖法》的改版而使得索書號有所變動,信息熵分類系統卻不會因此而變動并仍然可以被使用。如上所述,信息熵分類法在整個圖書分類決策中起到補充和輔助的作用,與傳統分類并不沖突。傳統分類法的類名力求科學、準確、規范、穩定;信息熵分類法的類名力求通俗、易懂、時新、簡煉、實用,但科學性不強,它主要針對的是圖書類目的細分,目的在于方便讀者借閱。這就意味著,它必須以傳統分類為大的前提,并隱性體現。
筆者所提出的信息熵分類法,仍然針對圖書內容本身,與傳統分類方法相融合卻不混淆,在刻板的分類標準下,又融入借閱者的思想,為借閱者提供更多的便利。客觀評價,此類方法仍存在缺點,由于圖書分類中主題詞提煉的人性化與全面化,使得分類目錄更加詳細,由此便使得圖書館工作人員的任務量有所增加,主要集中在編目工作者的身上。圖書館可以通過工作程序的調整和接納編目志愿者的方法來緩解這種工作壓力,因為普通用戶的介入更能直接體現用戶的隱性注意力,這樣便使得人力資源“取之于民而用之于民”。
除此之外,由于考慮太多的人性化因素,使分類體系不夠嚴密,主題詞提煉順序缺乏規律,詞語覆蓋不全或繁冗多余。但是,站在整個圖書館的立場考慮,為防止用戶流失,信息熵分類方法的引入可謂利大于弊。
[1] 夏永蓁.改革傳統的分類方法:談對“分類目錄細分,分類排架粗分”的再認識[J].國家圖書館學刊,2000(1):87-89.
[2] 林君莊.關于圖書熵值問題的思考[J].福建師大福清分校學報,1999(4):103-105.
[3] 余貴華,徐寶祥,鄭榮.關于信息和熵基本性質的辨析及哲學思考[J].情報科學,2009(5):770-773.
[4] 王艷等.基于分類方法的內容過濾推薦技術[J].情報雜志,2005(8):59-62.
[5] 衛紅.淺談圖書在版編目中存在的問題及做好這一工作的意義[J].醫學情報工作,1998(1):25-26.
[6] 貴應新.熵增加原理在文獻信息系統中的應用[J].江蘇圖書館學報,1994(1):5-7.
[7]歐錫梅.文獻編目的規范化與標準化——兼評《中國文獻編目規則》的出版[J].圖書館論壇,1999(4):55-57.