◆何子琳 趙忠堯 姜 波
(1.中國移動通信集團北京有限公司 北京 100007;2.北京飲冰科技有限公司 北京 100087)
企業網信息分類模型與物聯網實踐研究
◆何子琳1趙忠堯2姜 波2
(1.中國移動通信集團北京有限公司 北京 100007;2.北京飲冰科技有限公司 北京 100087)
本文介紹了一種適用于企業內網系統的信息分類模型,充分考慮到企業內網與目前傳統互聯網在信息分類方面的差別,從信息管理者、信息發送者、信息接收者三個信息用戶角色出發,分析討論了信息分類準則的選擇依據,在此基礎上提出了用戶感知且易于動態擴展的信息分類模型。通過結合某家企業內網IT架構現狀,舉例說明了用戶感知可擴展的二層信息分類模型的分類方法并在最后給出了一種基于SOA消息總線架構的模型實踐可行方案。該分類模型能夠滿足不同的用戶需求,具有很好的動態性能。
企業內網;信息分類模型;用戶感知;動態擴展
隨著企業人員規模、業務需求的不斷增長,企業內部需要通過大量各種類型的業務系統對復雜的業務流程進行支撐。以某企業為例,企業內部 IT架構經過多年的建設已經形成了數十個系統的規模,涵蓋門戶應用、ERP、OA、業務支撐系統、經營分析系統等,各系統之間協同工作,支撐公司內部管理、外部運營等各項業務。
然而,如此眾多的業務系統會產生大量的信息,如待辦、通知、提醒、告警等信息,企業員工需要花精力對這些信息進行篩選,這不僅浪費了員工的時間,降低工作效率,同時某些員工真正迫切需要的信息往往被淹沒,那么如何能夠通過一種合理的信息分類機制與方法,從如此眾多的信息中提取出企業用戶真正感興趣、關心的信息,從而進一步提高工作效率,將是本文的研究重點。通過上述描述可以看出,信息分類對于企業內網信息化管理尤其重要,與此同時,信息的分類又要滿足用戶對于信息的快速檢索與獲取,因此需要找到一種合理的企業IT系統信息分類標準,以滿足企業管理要求。
分類是指人們把事物劃分成不同的類別,并且確定這些類別之間的包含與互斥關系。信息分類的方法有很多種,目前,信息分類的研究更多的是集中在互聯網網站信息分類中,通過網站信息科學合理的分類,能夠很好地方便用戶檢索到其需要的信息,大大增強了網站的用戶體驗感。文獻[1]給出了網絡信息分類的綜述,提出了網絡信息分類的意義與挑戰,文獻[2]中系統分析了網絡信息分類的體系結構,從信息體系結構,文本分類,信息檢索,web工程,網站設計五個方面介紹了網絡信息分類體系結構。文獻[3-6]分別給出了網絡信息分類的方法與模型。文獻[7]中,作者給出了企業內部信息分類體系的基本框架及其系統的實現框架,其分類體系結構僅僅簡單地定義了相關信息分類,且其靜態分類方法并不適用于目前中國企業內部更新速度如此之快的業務模式,因此并不具有很強的參考意義。
從上述文獻成果可以看出,傳統的網絡信息分類方法固然能夠滿足其要求,但是企業信息內網與傳統網絡有著本質的不同,其最大的不同就在于企業內網系統數據信息業務類別更新速度快以及受眾類型的不一致。例如,企業內網不會像一個新聞網站一樣,其受眾均是新聞閱讀者,或者像一個圖書館信息系統,其受眾是圖書閱覽者,企業內網的信息受眾通常來自于各個部門,因此需要找出一種信息的分類方法,滿足企業內網信息的需求,這也正是本文的研究重點。
定義1 企業內網信息:指面向系統用戶的信息,其必須是通過人類可理解的文字,數字與格式所組織成的信息,如字符串、表格、圖片、視頻、音頻等。
從企業內網信息的使用者來看,其擁有以下三類用戶角色。
定義2 信息發起者:信息的發起者,此處可以包含系統本身與實際操作業務系統的使用者。
定義3信息接收者:信息的接收者,此處僅指實際接收業務系統信息的使用者。
定義4 信息管理者:對信息進行統一管理的用戶。
信息分類問題的研究目的有如下兩個方面:
. 使企業內部的信息更加有序規整地存儲,便于統一管理;
. 使信息能夠更快,更準確地傳達給信息接收者,方便閱讀以及第一時間獲取到信息中有價值的信息。
那么,對于信息的類別劃分存在著不同維度,即存在著不同的分類標準,如圖1所示。

圖1 同一信息的不同分類標準
如圖1所示,從信息內容上分,可以分為業務類信息、營銷類信息、技術類信息、管理類信息;從信息優先級上分,可以分為特急信息、緊急信息、一般信息;從信息關注程度上劃分,可以分為最受關注信息、一般信息、不受關注信息;從信息發布的時間先后來分,可以分為近1周信息、近2周信息等等。
由此可以看出,從不同的角度可以得到不同的類別,并且不同的人從不同的角度去觀察同一個信息都會有自己的一種分類準則。本課題信息分類機制的研究定義如下:
定義5 信息分類問題:給定一組信息集合I = {I1, I2, … In},需要尋找一組可擴展的信息分類準則C={C1,C2,…,Cm},m為分類準則數量,并將其進行組合形成一種分類機制Λ,ΛC使其滿足上述兩個目的:
. 使企業內網系統信息更加有序規整地存儲,便于統一管理;
. 使信息能夠更快,更準確的傳達給信息接收用戶,方便閱讀以及第一時間獲取到信息中有價值的信息。
這里不妨假設方便信息統一管理的評價指標為α,信息傳達的準確性用評價指標β表示,由此可以看出,信息分類問題最終可以歸結為一個多目標(此處為2個)優化問題,其數學表達式如公式(1)所示。
max α
max β

從公式(1)可以看出,該多目標問題由于其限制條件的不確定性,因此對于不同企業而言,其內網信息分類的通用數學模型如上,并且本文將提出一種求解上述模型的方法,并不給出某一個具體的優化解。
對于尋找一組信息分類評判依據,分類標準的選擇受到很多因素的影響,絕大多數是通過人的主觀判斷去選擇的。然而,通過仔細分析我們可以看出,兩個目標:信息管理便利性α與信息傳達準確性β均與一個定量因素有關,即是分類機制Λ中的評判準測的數量m,即

其中,∝為正比例符號,符號左邊正比例與公式右邊,公式(2)與(3)分別說明,信息管理的便攜性正比例與評判準則的數量,但是信息傳達的準確性卻反比于評判準則數量。圖2顯示了α,β與m三者之間數量關系,在三維空間中表示。從圖2可以看出,兩個目標之間隨著 m的變化,其結果呈現出截然相反的變化趨勢,特別注意的是,α,β與m之間的比例關系可以是線性的也可以是非線性的(通常為非線性的)。

圖2 信息分類標準數量與兩個目標的關系
上述關系是不難解釋的。首先考察坐標系β-O-m,即分類準則數量與信息管理便利性之間的關系,信息分類評判準則數量m越多,對于一個信息的描述的完整性越好,越充分,越容易定位該信息,因此對于用戶而言,用戶能夠感知到該信息的概率也越大;其次考察坐標系α-O-m,即分類準則數量與信息管理便利性之間的關系,評判準則數量 m越多,對于信息的統一管理便利性則越差,因為不論是采用何種數據結構,如樹狀、圖狀,不同的分類維度會提高信息分類的維護成本,尤其是針對企業內網的業務系統所產生的信息,因為企業(尤其是當今中國企業)的業務發展與變化非常之快。
針對上述分析,一種較為原始的想法是尋找到α,β與m三者間的一個最佳契合點,即在三維空間α-β-m中尋找一個最佳點S’= (α’, β’, m’),該 S’中的分類評判準則數量 m’既能夠滿足管理的便利性α’,同時又能對一個信息進行較為完整的描述β’。當然,針對不同企業內部的不同情況,即公式(1)中的約束條件,總能夠找到這個相對于某一個具體企業的最優點S’,只是求解這個最優點的方法有所不同(不同企業的管理者的主觀判斷不同),但是不管如何,這個點通過某些方法是能夠找到的,只是尋找S’的方法不盡相同,我們無法找到一個通用普適的方法,因此尋找最優值的方法不在本文討論范圍之內,這里特此說明。
上述我們已經討論了公式(1)中兩個目標α,β與一元變量-Λ中的評判準測的數量m之間的關系,并且討論了最佳契合點即是需要我們去尋找的點。但是,上述的最佳契合點并不完全滿足定義5,其違背了分類評判標注可擴展的原則,即若能尋找到該契合點,則Λ中的m是不會改變的,這意味著整套信息分類機制中,信息的分類是靜態的,而不是動態的,這對于現代化企業而言,是不切合實際的,沒有解決信息管理便利性與信息傳輸準確性之間的矛盾。
解決上述問題的方法是將α,β與m三者間的關系從不同的信息用戶視角分解。通過分析可知,信息管理便利性α與信息傳達準確性β兩者分別是從兩個不同的角度去觀察同一個問題。信息管理便利性α是從系統的角度去看信息分類問題,而信息傳達準確性β則是從用戶的角度去看信息分類問題,如圖3所示。

圖3 基于不同信息用戶角色的分類準則
從圖3中可以看出,三個不同類型的線段分別表示不同的分類準則集合 Λs,Λm,Λr,對于信息管理者而言,其所關心的僅僅是按照信息的客觀屬性這一個分類準則 Λm(如信息是是屬于多媒體信息或者文本的等),如系統監控類、新聞資訊類、平臺支撐類等;而對于信息用戶而言(發起或接收者),其所關心的除了按照信息客觀屬性分類以外,還需要有自己的差異化分類準則,即Λs+Λm,從而更好地對某條信息進行描述與精確定位,如信息發起用戶,其關心發起信息的目標受眾是誰,因此對于該類用戶而言,可以按照目標群體的類別對信息進行劃分;而信息接收用戶,其并不關心這個信息是發給他自己或是發給其它人的,而關心的是該信息對其本身是否有價值,其分類準則是根據其興趣進行劃分的,即Λr+Λm。
通過上述分析可得,企業內網信息分類需從不同用戶的角度對分類準則進行描述,這樣對于信息管理者而言,由于按照信息的客觀屬性準則進行信息分類,分類數量 m相對較為穩定,利于管理,而對于用戶而言,分類標準可擴展并且可配置,增加了其靈活可擴展性。
根據3.1節中的分析,企業內網信息分類機制應采用完全分離的兩層,分別為信息管理分類層與信息用戶分類層。對于信息管理分類層,其信息分類準則不僅對于信息管理者有意義,對于信息用戶同樣也有意義;對于信息用戶分類層,其僅對用戶有意義,而對于信息系統的管理者,其無需關心[8,9]。分類機制總體模型如圖4所示。

圖4 兩層信息分類模型
從圖4說明如下,信息分類機制模型分為兩個層次,第一層為信息客觀屬性分類標準C,直接根據這個標準,將信息進行類別劃分,得到類別1,2,……,其分類不僅被信息的管理者關注,同時被信息用戶關注;第二層為可擴展的信息分類標準平臺,其上維護著信息收/發用戶自己感興趣的信息分類標準C1,C2,… …,根據不同的分類標準,會得到不同的信息分類,如類1.1,1.2……。信息管理者盡管對第一層的信息分類感興趣,但是其需要對整個信息分類機制的分類策略進行管理。
由于第一層與第二層間的具有聯系,如對于信息收/發用戶而言,其既關注第一層也關注第二層,因此需要在第一層與第二層之間建立組合關系將這兩層分類進行組合配置。根據圖3中的分類準則定義,圖4的2層分類模型可以用圖5進行簡化。
這種分類機制模型是滿足定義5中的兩個目標的。首先,采用層類別評判標準的管理是從不同用戶的角度出發的,能夠從不同層面為不同用戶提供分類服務,尤其是對于信息本身的管理而言,其僅需要關心根據信息客觀屬性的分類標準進行分類后的信息類別,不論是在類別查找、刪除、修改,還是根據類別對信息進行歸檔,都十分便捷,尤其是信息歸檔處理,其分類標準是一維的,因此管理起來尤其方便。

圖5 兩層信息分類模型樹狀表示
其次,通過提供第二層的可擴展的信息分類標準平臺,其能夠根據不同用戶的需要,進行分類評判標準的擴展與動態管理,這增強了一個信息的描述完整性。
最后,將兩層進行獨立開,并通過在兩層間的組合關系的配置,增強了各種信息類別標準與信息客觀屬性間類別的配置靈活性,是一種松耦合的設計,不論是從維護還是從二次擴充開發的角度,都具有一定的優勢。
基于3.2節中提出的分類機制模型并結合某家企業內網IT系統信息,給出如下參考分類準測并舉例。
分類準則m:根據信息客觀屬性進行分類。
目前該企業IT系統信息可以分為以下九類,如表1所示。

表1 分類準則m的分類結果

m.02 自媒體發布類m.03 系統變更類m.04 業務數據類m.05 待辦類m.06 通知類m.07 新聞資訊類m.08 生活資訊類m.09 其它
類別編碼中,第一位 m表示其為信息管理類別編碼,最后兩位表示其順序編號,編號采用2位十進制數表示,為了便于管理,建議該層分類數最多不超過2位數。
第二層根據信息用戶的角度去進行分類準則制定。
分類準則s.01:根據信息接收用戶范圍分類。

表2 分類準則s.01的分類結果
用戶信息分類編碼不同于信息管理分類編碼,其采用三段式編碼,即首位s表示其為信息發送用戶的信息分類(接收用戶為r),中間一位表示分類準則編號,每個分類準則后面為兩位分類編號。
分類準則r.01:根據信息的發布時間分類。
盜用別人思想、算法或結論。學術論文講究創新和研究結論,如果沒有研究成果或創新性的東西,該論文是沒有發表意義的。經常有作者在沒有研究成果的情況下,為了發表論文,盜用別人的思想或算法或結論,占為己有,在參考文獻中刻意地回避引用參考文獻,特別是英文參考文獻。

表3 分類準則r.01的分類結果
分類準則r.02:根據信息的關注度分類。

表4 分類準則r.02的分類結果
根據用戶感知的兩層信息分類機制模型,信息分類機制的技術解決方案應用框架設計如下圖6所示。

圖6 原型設計
從圖6可以看出,信息分類管理中心解決方案應包含三個模塊:
. 分類策略配置中心模塊:用于存儲信息分類策略與配置;
. 分類配置管理子系統:用于信息共享中心,是管理員配置信息分類策略與配置的入口;
. 與業務系統信息集成的消息總線:用戶統一傳輸各個業務系統間的消息。
方案向集成于SOA信息總線上的業務系統提供兩個服務接口。這里我們將第一層(信息管理層)按照信息客觀屬性準則分類的模塊稱為信息分類器,其目的在于對信息進行分類,便于信息管理者對信息進行存儲管理;將第二層(信息用戶層)的各個分類準則叫做信息過濾器,其作用是為信息用戶的信息打上分類標簽。因此兩個服務組件接口分別為:分類器服務組件接口;過濾器服務組件接口。通過這兩個服務組件,一條消息對應著一個信息管理層的分類,但是可以對應著多個信息用戶層的分類。
不論是各個業務系統中的信息發送模塊還是信息接收模塊均需要調用分類器服務組件接口,而對于過濾器服務組件,根據其業務系統的特點以及接收與發送方的特點,用戶可以自行選擇與分類器想配套的過濾器進行組合。與此同時,信息過濾器組件還提供用戶可配置分類準則與分類接口,供用戶自行配置。
本文從對信息分類問題進行了系統化的定義,明確系統信息的研究范圍,給出信息分類機制的現狀調研與用戶感知可擴展的信息分類機制研究。在調研相關研究現狀的基礎上,提出了一種用戶感知可擴展的信息分類機制,從不同用戶角度考慮,將信息分類機制分為兩層分類模型進行分析,分別從信息管理、信息用戶兩個方面抽象出信息分類器與信息過濾器,通過兩者間的靈活配置與組合,能夠同時滿足信息管理者、信息發送者、信息接收者三個不同角色的需要。
最后,結合信息分類機制理論以及SOA的軟件構建思想,給出了一種可行的分類機制解決方案。本文下一步的研究工作將具體深入研究消息過濾器與消息分類器間的過濾算法以及如何提高消息分類準確率,并且建立一套合理的信息分類評價體系。
[1]Mai JE. Classification of the Web: challenges and inqu iries[J].Knowledge Organization,2004.
[2]吳勝.網站信息分類體系優化及應用[D].南京林業大學,2009.
[3]崔艷華.網絡信息分類體系的研究[J].圖書館學刊,2006.
[4]陳樹年.網絡信息的自動分類問題[J].圖書館雜志,2001.
[5]程曉林.網站分類法的比較研究[J].晉圖學刊,2006.
[6]陳樹年.網絡信息分類法研究[J].現代圖書情報技術,2002.
[7]黃錦德.企業信息化建設中的信息分類及編碼規劃[C].全國冶金自動化信息網,2012.
[8]何偉明.計算機網絡技術安全與網絡防御策略研討[J].網絡安全技術與應用,2017.
[9]張亞輝.計算機網絡存在的安全漏洞及應急響應技術研究[J].網絡安全技術與應用,2016.
北京市科技計劃專項課題計劃(Z17010101514)資助。