唐修益,羅 竟,黃 偉
(1.廣西紅河高速公路有限公司,廣西 南寧 530022;2.廣西交通職業技術學院,廣西 南寧 530023)
公路數字化檔案唯一性標識編碼研究
唐修益1,羅 竟2,黃 偉1
(1.廣西紅河高速公路有限公司,廣西 南寧 530022;2.廣西交通職業技術學院,廣西 南寧 530023)
唯一性標識編碼是公路數字化檔案信息資源管理和應用的最基本單元。文章通過對公路工程檔案資料的分析、整理、歸類,借鑒國內外期刊文獻數字對象唯一標識符方法,創立適用于公路數字化檔案管理的“項目代號+屬性+類別+流水號”四段位方式的編碼規則,并將編碼規則應用到計算機管理軟件,實現了計算機對公路數字檔案材料的自動編碼,為計算機檢索、管理提供了便捷途徑。
公路數字化檔案;唯一性;編碼段位;樹形結構;概率
高速公路紙質載體工程檔案平均每公里約100案卷,二級及其他等級公路檔案每公里案卷達50~80案卷。這些工程檔案全天候占用大量的庫房,花費巨大的人力、物力。將數量龐大的工程檔案信息化處理后,利用云存儲技術,網絡平臺,將傳統的實體紙質檔案建設成為數字化網絡檔案,是我國公路工程檔案信息化建設的方向。其關鍵核心技術之一是項目文件材料的標識編碼。而我國至今還沒有成熟、通用的,專用于公路工程檔案唯一性標識編碼的規則和方法。因此,需要立項研究公路工程檔案唯一性標識編碼[1]。
1.1 唯一性標識編碼現狀
唯一性標識編碼,國際上通常稱之為數字對象標識符。其研究和重視始于20世紀90年代國際互聯網聯盟(World Wide Web Consortium,W3C)和Internet工程任務組(Internet Engineering Task Force,IETF),規定了統一資源標識符(簡稱URI)、統一資源名稱(簡稱URN)標識框架。其研究任務就是把經過信息化處理后的數字對象用唯一的標識符將其識別,以方便計算機對這些數字化的信息進行管理和利用。我國的居民身份證號碼就是典型的唯一標識編碼,唯一地標識每個中國公民。
我國部分行業對唯一性標識編碼已開展研究。有影響力的如中國標準書號[2],國家藥品編碼方法[3],國外的期刊及文獻內容標識符(SICI)、數字對象標識符(DOI)、出版物標識符(PII)等編碼方案。公路工程項目文件種類繁多,組成復雜,編碼需要表達某一具體文件的頁碼,散裝材料需要單獨進行處理。交通運輸部頒發的《公路試驗檢測數據報告編制導則》(JT/T 828-2012)[4],基于試驗報告數據可追溯性為出發點,發揮試驗檢測數據對工程質量控制的基礎作用,僅制定了試驗表格的系列編碼規則,如8位數的試驗檢測報告唯一性標識編碼,7位數的試驗檢測記錄表的唯一性標識編碼。但其編碼規則不適合用于工程檔案[4]。我國至今尚未建立與工程相關性有著良好關系的公路工程檔案標識編碼規則、方法[5]。
1.2 公路工程檔案的特征
公路行業普遍采用格式化表格來記錄工程質量數據、原始施工信息。公路文件表格具有表格類型差異化、格式多樣化、內容專業化、種類復雜化等特點。國內已有的編碼規則,多從實施過程中強調某一功能而編碼,并不適合計算機管理公路工程數字化檔案的需要。同時,各種非表格類材料,如各類紅頭文件、施工方案、聲像、已經成卷成冊的研究報告、設計圖等等,數量龐大。這些因素,很難實現等長編碼,或者全部數字編碼。
由于公路建設投資主體的多元化和行業習慣的差異性,同一地區內不同業主所使用的表格也大相徑庭。實施過程中,承包人、監理或業主可根據各自的理解,隨意修改、增刪表格。
對公路工程檔案進行信息化建設,采用云技術將傳統的紙質載體的實體檔案遷徙為網絡檔案,面臨的問題就是實現所有數字化檔案“一頁一碼”,搭建樹枝狀目錄,并建立編碼標識與歸檔材料類別、信息化處理文件的錄入與上傳、組卷方式、檢索查詢之間的相關關系。
2.1 收集、立卷、歸檔的依據
交通運輸部2010年頒發的《公路工程竣(交)工驗收辦法實施細則》(交公路發〔2010〕65號)[6]、《公路建設項目文件材料立卷歸檔管理辦法》(交辦發〔2010〕382號)[7]及國家檔案局頒發的相關規范、文件、標準,均作為標識編碼研究的依據。
項目建設過程中,還涉及文獻[6]規定收集范圍之外的臨時材料的編碼。
2.2 歸檔材料的分類
通過對工程檔案歸檔材料的甄別,任何一份歸檔文件,均可歸入以下六大類[8]的其中一類。
(1)單位分部分項工序類。監理、施工單位所收集的各工序成品驗收,監理旁站記錄,施工原始記錄,單位分部分項工序工程質量檢驗評定,中間交工證書等,這類材料,其明顯特征是任何一張表格或文檔,脫離不了其所依附的單位分部分項工序。
(2)年度+批次類。項目業主、監理、承包人、各實驗室等參建單位所形成的標準試驗,材料試驗,工程變更,工地會議紀要,監理工作指令及反饋,土地征用,分期計量,工程管理文件,工程交(竣)工文件,施工日志,監理日志,巡視記錄,天氣、溫度及自然災害等,這些材料,均與年度、批次有關。
(3)散裝類。項目建議書,工程可行性研究報告,招投標文件,審計報告,財務結算文件,工程決算文件,監理規劃,(建設、施工、監理、監督、設計)工作總結等,這些材料,基本獨立成冊,且各立卷歸檔單位以“件”為單元進行整理、歸檔。
(4)圖紙類。初步設計、施工圖設計、工程變更圖紙、竣工圖等,這些已經裝訂成冊的圖紙,其本身每一頁已經有圖號或頁碼,每一冊已有獨立目錄。
(5)聲像類。聲像類屬于特殊載體的檔案,目前多為數碼相機拍照的照片。
(6)其他。有些材料,無法歸入上述范圍,則采取靈活方式。如通道兩端連接引道的涵洞、土方,屬于線外工程,以及一些為當地老百姓造福的一些項目等。
2.3 標識編碼考慮因素
需要編碼的工程檔案包括案卷卷皮的檔號,卷內目錄的每個文件號,歸檔內容的每頁(件)及備考表。為確保編碼的唯一性,并與工程性質相關性建立關系,檔案標識編碼需要考慮以下因素。
(1)路線代號。國家高速公路網、各省高速公路網及地方高速公路網均對規劃中的每條高速公路規定了路線代號,如廣州至昆明高速公路代號為G80,省高速公路網的廣西武宣至平果高速公路代號為S52。列入政府批準規劃的非高速公路的國道、省道、縣道也規定了路線代號。
(2)立卷單位。一個公路項目的工程檔案立卷單位,通常有項目業主、監理、承包商、科研、營運公司。前期項目文件通常由項目業主整理歸檔。中心實驗室列入監理范圍。材料供應商列入承包人范圍。
(3)材料類別。材料立卷歸檔,在文獻[6]每部分第一層次劃分的前提下,還要按照單位分部分項、年度批次、散裝、圖紙、聲像及其他因素進一步細分。
(4)流水號。案卷的順序號、卷內目錄的文件順序號及歸檔材料的頁號均歸結為流水號。
3.1 “四段位”的構架
課題組經過多次反復論證,首創了國內“項目代號+屬性+類別+流水號”的“四段位”公路工程數字化檔案唯一性標識編碼,將公路工程立卷歸檔材料全部賦予“一頁(件)一碼”,并與工程相關性建立良好關系,實現了計算機一對多、多對一、一對一的檔案管理。
實行計算機管理的數字化檔案唯一性標識編碼的核心問題是要找到每一案卷、每一個文件、每一頁的干支拓撲關系。
圖1為四段位編碼構架示例。
圖1 項目標識符編碼范例圖
圖1的編碼含義為:省高速公路網(S52),廣西壯族自治區(GX),來賓至馬山段(LM),項目業主歸檔的綜合文件(100),建設依據類(2),第1件(1),第65案卷(065),第1個文件(001)。
3.2 “四段位”編碼分析
《公路數字化檔案唯一性標識編碼詞典》[8]詳細介紹了公路工程檔案的編碼。
(1)項目代號。項目代號分3級,即第1級為路線代號,如S52、G80。第2級為省、自治區、直轄市、特別行政區的字母碼,由中華人民共和國國家標準《中華人民共和國行政區劃代碼》(GB/T 2260-2007)[9]規定,如廣西為GX,山西為SX,陜西為SN,湖南為HN,海南為HI,河南為HA。第3級為建設項目具體段落代號,采用路段起訖位置地名的第一個拼音字母碼組合。各省市劃分有縣、鄉級的字母碼,如LM標識來賓至馬山段。規劃中的一條高速公路內,若一個省內有兩個建設路段的起訖地名首字拼音碼組合相同時,可以采用訖、起地名首字拼音組合。再有重名,則取起或訖地名第二個拼音字母碼,依次類推。課題選取全國29個省、直轄市、自治區的2 315個地名和途徑以上地區的592條高速公路的數據進行實驗分析,第一種情況的重復率最大為4.8×10-3%;取起或訖地名第二拼音字母組合的重復率都為0。所以在實際的應用中,采用路段起訖位置地名的第一個字母碼與起點或終點的第二個字母碼組合的方式可以消除重復現象,使得唯一性得到了保障。
(2)屬性。屬性劃分為兩級,第1級代碼為對應文獻[6]附件二的5個部分,再增加通車后營運公司,共6個部分的數字代號。第2級代碼為立卷單位,同時也表征案卷所在的段落屬性。參建單位劃分為項目業主,各總監辦、各標段或分部(工區)。經過調查,任何一個建設項目,其標段劃分,不會超過99個標段。故立卷單位的代號按路線前進方向劃分段落,采用兩位流水號。整個屬性代號由兩級累計3位數代號,如第三總監辦的資料屬性代號為303,土建一標代號為401。
(3)類別。類別劃分為兩個級別代碼。第1級類別代碼為文獻[6]中的各部分第1層次的綱。第2級類別代碼為前面所屬的六大類材料。
(4)流水號。記錄每一卷、每一件乃至每一頁的流水順序號。案卷封面的檔號,其流水號為本案卷在總案卷的排列序號;卷內目錄的流水號,則為序號的流水號;每頁(件)的流水號,則為該類別材料的頁數流水號。為統一,流水號統一定義為3位數,不足時,用0補足位數。
綜合上面的4個段位,為了確保編碼的延續性、清晰性、不等長性,方便計算機定位,依次將各段位串起來,之間插入“—”或“·”,將各段位分隔,以示區分段位,并利于計算機查詢。
軟件自動生成各類表格標題欄及基本信息區、表格二維碼,減輕了人工錄入工作量和出錯率,提高了信息化處理后的上傳速度。系統對編碼的字母不分大小寫,方便了用戶使用。圖2為某表的截圖[10]。
圖2 自動生成標題欄和基本信息區截圖
促進云計算創新發展,培育壯大新業態、新產業是國務院鼓勵發展的新興產業,是信息化發展的重大變革和必然趨勢[11]。
S52廣西武宣至平果高速公路來賓至馬山段、馬山至平果段是廣西區內首次全面推行數字化檔案建設的高速公路項目。廣西紅河高速公路有限公司、廣西正和高速公路有限公司和廣西寶祥工程咨詢有限公司從2012年開始,聯合開發的公路數字化檔案管理系統,采用云存儲,借助互聯網平臺,有望將工程檔案全部實現網絡化。
注:本文編碼方法已獲自治區版權局頒發的版權證(桂作登記-20-2014-A-000299),版權所有
[1]國家檔案局.2014年度國家檔案局科技項目計劃(檔函〔2014〕114號)[Z].北京:國家檔案局,2014.
[2]GB/T 5795-2006,中國標準書號[S].
[3]GB18937,國家藥品編碼本位碼編制規則[S].
[4]JT/T 828-2012,公路試驗檢測數據報告編制導則[S].
[5]黃汝維,等.高速公路數字化檔案標識編碼的唯一性論證報告[R].廣西大學,2014.
[6]交通運輸部.公路工程竣(交)工驗收辦法實施細則(交公路發〔2010〕65號)[Z].北京:交通運輸部,2010.
[7]交通運輸部.公路建設項目文件材料立卷歸檔管理辦法(交辦發〔2010〕382號)[Z].北京:交通運輸部,2010.
[8]唐修益,等.公路數字化檔案唯一性標識編碼詞典[R].廣西紅河高速公路有限公司,2014.
[9]GB/T 2260-2007,中華人民共和國行政區劃代碼[S].
[10]唐修益,等.《高速公路工程檔案數字化建設》管理系統軟件使用手冊[Z].南寧:廣西紅河高速公路有限公司,2014.
[11]關于促進云計算創新發展培育信息產業新業態的意見.(國務院“國發〔2015〕5號)[Z].2015.
Research on Unique Identification Coding of Highway Digitized Archives
TANG Xiu-yi1,LUO Jing2,HUANG Wei1
(1.Guangxi Honghe Expressway Co.,Ltd.,Nanning,Guangxi,530022;2.Guangxi Vocational and Technical College of Communications,Nanning,Guangxi,530023)
The unique identification coding is the basic unit for the management and application of high-way digitized archival information resources.Through the analysis,sorting,classification of highway en-gineering archives,and by referring to the unique digital object identifier method in domestic and for-eign periodicals,this article established the four-section encoding rules of“project code + property + category + serial number”suitable for the highway digitized archives management,and used such en-coding rules in computer management software,which enables the computer to automatically encode the highway digitized archives,thereby providing a convenient way for computer retrieval and manage-ment.
Highway digitized archives;Uniqueness;Coding section;Tree structure;Probability
唐修益(1970—),高級工程師,從事公路工程建設管理工作;羅 竟(1964—),高級講師,從事公路教學、科研工作;黃 偉(1970—),高級工程師,從事路橋工程施工、建設管理工作。
國家檔案局科技項目“基于唯一性標識編碼與公路數字化檔案相關性的應用研究”(編號:2014-X-57)
U
A
10.13282/j.cnki.wccst.2015.07.020
1673-4874(2015)07-0090-04
2015-06-05