摘要:結合滁州學院的信息化實踐,分析了信息編碼工作的基本流程,討論了基于統一信息編碼的系統集成方案,設計了高等學校核心代碼的編制方案,討論了編碼方案的實施策略。
關鍵詞:信息編碼;信息化;新建本科院校;信息標準
引言
新建本科院校大多都是從專科院校升格而來,其管理體制及管理水平等仍然帶有一定的專科特點,信息化意識不強,信息化建設缺乏統一的規劃,各類應用系統通常互相獨立,缺乏統一標準,應用系統之間無法共享數據,也無法實現應用集成,形成了一個個信息孤島。這些問題與本科辦學規范的矛盾日益突出,迫切需要從全校的高度,統一規劃、統一編碼,建設數字化校園。
信息編碼將事物或概念賦予有一定規律、便于計算機和人識別及處理的符號,形成代碼元素集合。信息編碼對于數據庫設計起著類似“數據字典”的作用,是建立數據中心、數據交換平臺等應用支撐環境的必要基礎,是高校信息化建設中重要的基礎工作。高校信息化的各個方面都應遵循相應的標準,信息編碼作為信息資源標準的組成部分,也必須遵循相關標準。
我校是一所2004年升格的本科院校,雖然1999年較早地建成了校園網并陸續提供了各類應用服務,但隨著學校層次的提升,借助信息化來規范管理、提高效率的要求愈來愈迫切。2006年,我校制定了“完善基礎設施,建立基礎信息平臺,豐富各類應用”的三年建設規劃,先行開展標準信息編碼工作,以為建立數據中心和門戶網站做準備。
1、信息編碼工作的流程
1.1確定信息編碼對象
信息編碼之前,應先對信息分類。參照教育部的有關標準,高校信息一般分為學校基本情況、辦公管理、學生、教職工、教學、科研、體育衛生、財務、資產與設備等管理信息標準集C3),每個信息標準集下分信息子集,信息子集下再分信息類,信息類是相關信息項的集合,如圖1所示。信息標準集中最基本的描述是信息項的屬性(字段名、類型、寬度等)。

1.2分析現有編碼
編碼應符合惟一性、規范性、可擴展性、實用性、穩定性和可實施性等要求。在開展校內標準編碼工作時,同一信息項在校內常常有幾套編碼同時運行,例如,財務處、人事處、教務處、圖書館各有一套教職工的代碼,這就需要信息編碼工作人員科學地采用其中一種編碼方案抑或編制一種新的編碼。如果現有的某一套編碼基本符合編碼的各項要求,則應盡量采用原有的編碼。如果都不合理,應遵循國家、教育部的有關標準制定新編碼。
1.3確定編碼方案
對每一編碼對象設計編碼規則,選擇代碼類型、確定代碼長度和結構,并以表格形式說明。考慮到高校機構、人員的變化情況,人員、機構、專業等編碼中應加入時間戳。以部門類為例,其信息項包括:部門號、部門全稱、部門簡稱、部門簡拼、英文簡稱、英文全稱、建立時間、負責人等,如表1所示。

代碼型按編碼形式可分為:字符型、數字型和結合型代碼。字符型編碼采用英文字母或漢字;純數字的編碼中只有0-9的數字,使用普遍;結合型的編碼則既含有字符編碼也有數字編碼。含義豐富但輸入復雜,不利于終端查詢(如電話機),一般不建議使用。按編碼的形式分為實義型和無實義型代碼。實義型編碼中可以推斷出編碼對象的部分屬性,易于識別對象。無實義型編碼則僅起到代替編碼對象的作用,不提供其他信息。
代碼長度力求使用最少位的代碼表示最多的信息,以利于記憶和維護。
代碼結構構成編碼表達式的位置或位置組的數目,以及每一位置上有效字符的集合。代碼結構可用表格形式說明。
1.4編制代碼
將具體的編制工作分工到各相關部門和個人。可以手工編制,也可以開發專門的編碼管理系統來編制、修改各類代碼。在實際操作中,也可與從事高校信息化的公司合作編制,以便縮短編制和實施周期。
1.5發文公布編碼方案
信息編碼工作事關全校,因此,編碼完成后,應將編碼方案以正式文件下發到校內所有部門,對于某些編碼對象(如部門)還應將具體代碼一并發文。
1.6編碼實施與維護
編碼實施要考慮新舊代碼的更替、今后的維護等問題。設備等物的編碼可統一應用新編碼,人員則可根據學校情況采用“新人新代碼,老人老代碼”的過渡方式。在新舊代碼的并行使用期,有時需要將新舊系統分別部署在不同的硬件上。
編碼工作是長期和持續的,如學校每年都有新的人員和事物,需要編制;現有人、物的信息也會有變動修改。因此,必須明確“誰權威,誰產生,誰維護”的原則,保證代碼維護的權威性和一致性。例如,我校的人事處負責教職工的編碼,教務處負責全日制學生、課程、專業的編碼,繼續教育學院負責成教學生的編碼,校辦公室負責部門編碼等。
2、高校核心信息的編碼
高校涉及教學的數據最為核心,也最復雜。這些數據涉及部門、教工、專業、學生、課程五個信息類,其中的大多數信息項可參考教育部的《教育管理信息化標準》和相關國家標準,而起到關鍵字作用的信息項則需要高校自行編制,如院系部所中心號、教工號、學號、專業號和課程號等。這些關鍵字信息項是信息類的數據間進行交換和共享的橋梁,必須惟一。
部門(院系所部中心)號一般采用2-4位的純數字、分層編碼。例如,采用ABB的編碼結構,其中A為部門類別代碼,取值為1表示行政單位,取值為2表示教學單位等;BB為順序號,取值為1-99。
專業號可參照教育部的標準專業代碼,也可自編。我校專業號采用8位純數字編碼,編碼結構為AABBCCDD,其中AA為學生類別代碼(參照教育部DM-XSLB《學生類別代碼》),例如,取值21表示全日制本科生。BBCCDD的取值參照教育部DM-BZKZY《高等學校本、專科專業代碼》,例如,取值為040105表示小學教育專業。
課程號一般由專業號、專業類別號、流水號組成。我校的課程號編碼結構為AABBCCDDEFFF,AABBCCDD為課程所在專業的代碼;E為課程性質代碼,例如,取值為1表示公共基礎課;FFF為順序號。
學號可采用由入校年份、專業號、流水號等組成的編碼,這種編碼能識別出是某專業的學生,但學生轉專業后需更改代碼。也可采用由入校年份、類別碼和流水號組成編碼,這種編碼編制后終身不變,管理方便。例如,我校采用的學號編碼結構為AAAABBCCCC,其中AAAA為入校年份;BB為學生類別代碼,取值參照教育部DM-XSLB標準;CCCC為流水號。
教工號可采用由部門號、流水號組成的編碼。例如,我校教職號的編碼結構為AAABBB,其中AAA為部門代碼;BBB為人員順序號。教工號和學號可采用相同的編碼方案,通過類別碼區分師生。例如,采用AAAABBCCCC的編碼結構,BB取值為99表示教職工。
3、基于標準信息編碼的數據交換
對已有的業務系統,基于統一的標準信息編碼,可以采用兩種方案消除信息孤島現象,實現數據交換,如圖2所示。

方案一:點對點式的數據交換。對已有的業務系統,可在其數據庫中擴充字段,將統一標準編碼以對照表的方式引入到各系統數據庫中,各業務系統仍按原有編碼方案運行,但當其與其它系統交互時,則按照統一編碼在兩個不同的系統間流動數據。這一方案消除了不同業務數據庫間同類信息對象的異構標識間的大量數據轉換,保證了數據資源對象的惟一性和可交互性。但點對點方式不能實現多個系統的全局數據交互,且當業務系統增多時,數據連接總數呈平方級增長。
方案二:數據中心方式的數據交換。校園數據中心從各業務系統中搜集該系統的權威數據,并按照統一的信息編碼,形成校內的核心共享數據庫。各業務系統仍按原有編碼方案運行,當該系統需要將數據更新到共享庫中時,業務系統才按照統一編碼與系統內編碼的對照表,進行數據更新。其它系統從數據中心獲取的數據,也通過統一編碼與系統內編碼對照轉換后,存儲到系統內。
數據中心方式的數據交換,在交換的業務系統數增大時,總連接量僅呈線性增長,且形成了全校范圍內統一的、權威的共享數據,因此,此方案正在被越來越多的高校選用。
4、信息編碼的推進策略
編碼工作是信息化建設中的一項基礎而重要的工作,需要納入信息化建設的統籌規劃之中。我院的編碼工作,由院信息化建設領導小組統領,遵循“統一思想、總體規劃、全面分析、分工協作、穩步推進”的指導思想開展工作。
“統一思想”。信息編碼涉及多個部門,是全校的大事,各部門都要積極參與,而不應認為只是信息中心等具體建設部門的工作。這其中,學校領導的支持尤為重要。
“總體規劃、全面分析”。編碼時應站在學校信息化建設總體規劃的視角上,對現有的系統做全面的考察,保證編碼能被現有系統兼容,并支持將來的應用。
“分工協作”。信息編碼需要參與部門各司其職,既分工又合作。一般由信息(網絡)中心制定信息化編碼方案;各系、職能部門負責信息編碼的編制、應用和維護。信息中心等實施部門本著“服務、奉獻”的態度與校內各部門通力合作。
“穩步推進”。實施新編碼時,要做好現行編碼與新編碼同時運行的過渡。此外,信息編碼的實施最好能結合數據中心的建設等工作同時進行,以減少推行阻力。新建本科院校處于規范調整時期,是開展標準信息編碼及相關信息化建設的良好時機。
5、結束語
信息編碼標準化是消除信息孤島、互通校內信息的前提,也是學校規范管理的要求。高校信息編碼工作涉及到全校的人、物、事,編碼工作繁重。本文結合工作實踐,分析了信息編碼的基本流程,介紹了基于統一編碼的數據交換方案,并給出了核心信息的編碼方案和編碼推行策略。