■趙生輝
基于價值鏈的少數民族語言電子文件集成管理模型研究
■趙生輝
基于邁克爾-波特教授的“價值鏈”理論,本文構建了中國少數民族語言電子文件集成管理體系的架構模型。模型整體上分為三個部分:價值分析、基本增值活動、支持性活動。其中,基本增值活動包括前端控制、單元歸檔、集成歸檔和集成服務四個環節,稱為少數民族語言電子文件管理的生命周期;支持性活動主要有基礎設施、制度體系、組織架構和管理流程四個方面。基本活動和支持活動相互配合,共同完成少數民族語言電子文件集成管理的各項任務,實現管理的各類價值。
少數民族語言電子文件 集成管理 價值鏈
中國是一個統一的多民族國家,除主體民族漢族外,經過中央政府確認的少數民族共有55個,約占全國人口總數的8%,分布在占全國總面積50~60%的土地上。目前,55個少數民族共使用72種語言,有29個民族有記錄本民族語言的傳統文字。有的民族使用一種以上的文字,如傣語使用4種文字,景頗族使用2種文字,所以29個民族共使用54種文字[1]。中國政府在各民族地區實行民族平等的雙語或多語政策,少數民族文字信息處理研究得到國家相關機構的支持。20世紀80年代以來,國家先后制定發布了蒙古文、滿文、維吾爾文、哈薩克文、柯爾克孜文、藏文、朝鮮文、彝文、傣文等使用人口較多少數民族文字的計算機文字編碼、字型、術語等方面的國家標準,從1993年起又研究制定了基于ISO10646(Unicode)多文種平面的中國少數民族文字的編碼字符集標準,使得這些文字成為最先具備計算機處理能力的少數民族文字[2]。近年來,藏文、蒙古文、維吾爾文、彝文等少數民族文字辦公系統在部分地區的政府機構得到了應用;眾多的少數民族文字網站在互聯網上相繼亮相;民族地區廣播、電視、出版等文化機構也大多采用兼容少數民族文字的編輯和排版系統;民族古籍和語言文字資料整理過程中也會用到少數民族語言文字處理系統。民族地區信息化建設推進的同時,少數民族語言數字信息的數量也在持續增長,其中具有長期保存價值就是數字信息就屬于少數民族語言電子文件(ElectronicRecords)[3]。
少數民族語言電子文件管理是融合了管理、技術、法律、政治、文化等多個領域需求的綜合性、復雜性問題,具有環境復雜、目標多重、主體多元、客體多樣、技術異構、資源分散、方法綜合等特點;在滿足真實性、完整性和長期可讀性等基本需求的前提下,還需要考慮“跨語種信息共享”、“跨媒體信息整合”和“跨地域協作管理”等特殊需求。作為國家檔案事業的組成部分,民族地區按照“統一領導,分級管理”原則建立起來的檔案管理機制具有很多優點,卻無法從根本上解決少數民族語言電子文件管理面臨的重重矛盾,無法有效滿足少數民族語言電子文件管理的多種特殊需求,使少數民族語言電子文件處于高風險狀態的同時限制了其檔案價值的發揮。“集成管理”是從國家戰略視角對少數民族語言電子文件管理進行宏觀規劃和統籌之后提出的新模式。該模式以系統科學和集成理論為指導,在民族地區現有檔案事業管理機制的基礎上,將境內語種多樣、類型豐富、地域分散、技術異構的少數民族語言電子文件視為整體進行管理,建立一體化的制度體系、技術平臺、組織架構、流程規范,平衡少數民族語言電子文件管理中的“多元性需求”和“一體性需求”,整合電子文件形成機構、檔案管理機構、語言文字工作機構和民族事務管理機構的力量,化解分級分散管理所無法有效解決的諸多矛盾,最終為全國各族人民提供集成、高效、便捷的少數民族語言電子文件利用服務,滿足多層次的利用需求。
民族地區信息化建設問題研究正在由關注少數民族語言文字信息處理技術的“信息處理范式”向關注少數民族語言信息資源管理的“信息管理范式”轉型,理論體系還不成熟,大多數研究所關注的都是單一語種少數民族語言文字信息管理問題,研究成果所涉及的領域較為分散,大多數沒有觸及集成管理的核心矛盾和焦點問題。造成這種局面的主要原因在于缺乏較為系統的研究綱領,各類研究的戰略一致性難以得到保證。因此,從“頂層設計”的視角研究少數民族語言電子文件管理的整體性戰略,構建少數民族語言電子文件集成管理的架構模型,在國家戰略層面上確立的少數民族語言電子文件管理的基本原則,將對這一領域研究工作的開展和民族地區的信息化建設產生深遠影響。少數民族語言電子文件集成管理是涉及多個領域、多個層面的復雜性問題,為了對整個體系做更好地總結和梳理,本文特引入“價值鏈”模型進行分析,并基于價值鏈模型,構建中國少數民族語言電子文件集成管理的架構模型。
價值鏈(ValueChain)是美國哈佛商學院邁克爾·波特教授在其所著的《競爭優勢》一書中提出來的[4]。波特教授認為,每一個企業都是設計、生產、銷售、發送和輔助其產品的過程中進行種種活動的集合體,所有這些活動可以用一個“價值鏈”來表明。根據這種思想,他把企業內外價值增加的活動分為“基本活動”和“支持性活動”兩大類型。其中,“基本活動”涉及企業生產、銷售、進料后勤、發貨后勤、售后服務;“支持性活動”涉及人事、財務、計劃、研究與開發、采購等,基本活動和支持性活動構成了企業的價值鏈。根據價值鏈模型,不同的企業參與的價值活動中,并不是每個環節都創造價值,實際上只有某些特定的價值活動才真正創造價值,這些真正創造價值的經營活動,就是價值鏈上的“戰略環節”。企業要保持競爭優勢,就要密切關注組織的資源狀態,特別關注和培養在價值鏈的關鍵環節上獲得重要的核心競爭力。“價值鏈”理論雖然是從企業管理的角度提出的,實際上它反映的是所有社會組織的共同規律,對信息管理類機構改進管理同樣適用。對檔案管理機構而言,最終用戶能夠檢索到所需要的檔案信息,能夠利用檔案解決自己的問題,是以檔案在生命周期里所涉及的多個部門、多名工作人員的連續工作為前提和基礎的,整個過程構成檔案管理的“價值鏈”。而價值鏈上的各類活動,又可以整體上劃分為“基本活動”和“支撐活動”兩大類,這個規律對中國少數民族語言電子文件集成管理同樣適用。
1.價值體系
少數民族語言電子文件集成管理的價值分為社會價值和價值屬性兩個層面,社會價值從宏觀上反映整個管理體系存在的必要性,價值屬性從微觀上反映了電子文件要實現社會價值所需要具備的一些特征,反映了少數民族語言電子文件價值實現的過程。社會價值和價值屬性緊密聯系,社會價值是價值屬性實現的終極目標,價值屬性是社會機制實現的基礎。
少數民族語言電子文件集成管理的社會價值體現在檔案、政治、文化、經濟、科研等多個方面,最核心的主要有:第一,存史價值。通過一體化的存儲和管理網絡保存各個少數民族或少數民族相關機構在以計算機等現代信息技術為支撐的社會活動中直接形成的原始記錄,保障少數民族語言電子文件的真實性、完整性和可讀性,使承載著少數民族語言文化的電子文件可以科學管理、長久傳承。第二,利用價值。通過一體化的服務網絡,打破因地域和語言文字障礙而導致的交流困難,使少數民族語言電子文件可以被全國各族人民以自己熟悉的語言文字來訪問和利用,共享中華民族共同的文化財富。第三,政治價值。通過少數民族語言電子文件的集成管理,理順少數民族語言文字與國家通用語言文字之間的關系,建立起各民族之間溝通和交流的橋梁,增強各少數民族對中華民族的心理認同感,增強中華民族的凝聚力。
從價值屬性的角度來看,任何一份少數民族語言電子文件社會價值的實現都是以其具有必要的價值屬性為前提的。少數民族語言電子文件是電子文件的特殊類型,因此其價值屬性既包括一般性電子文件所必須具備的特征,也應該具備其特有的一些特征。少數民族語言電子文件的一般性價值屬性主要包括:第一,真實性(Authenticity),電子文件具有可以被證明確實是在對應的社會活動中直接形成并且核心內容保持不變的性質;第二,完整性(Integrity),電子文件從創建的那一刻起,一直未被破壞過,并一直保持著作為證據要求的所有要素;第三,可讀性(Readability)是電子文件可以在任何需要的時候具備可以被讀取與識別的能力;第四,安全性(Security)是指電子文件在生命周期內沒有因為來自載體、系統、環境等因素的影響而發生非法竊取、變更和損毀。少數民族語言電子文件的個性化價值特征主要包括:第一,可獲性(Availability)是指信息可以跨越地域被用戶以較低的成本、較便捷的方式獲取的能力;第二,可懂性(Understandability)是指電子文件具備可以為用戶所讀取和理解的屬性,其中最重要的要是跨越語言障礙;第三,專業性(Professionalism),由擅長特定語種的地區和人員進行專業化管理以保障工作質量。
2.基本增值活動
基本增值活動是價值鏈當中參與核心價值創造的活動,少數民族語言電子文件集成管理模式的基本活動主要有四項,分別是:
第一,按照統一的原則和要求,進行“前端控制”。電子文件與傳統文件不同的是電子文件更加脆弱,如果不提前加以控制,有可能導致記憶完全喪失,因此在對電子文件管理系統的設計階段就要積極參與。前端控制就是在文件形成之前就提前介入,維護文件的歸檔質量,將對文件實體的關注轉向對文件形成過程的關注。同時,電子文件必須對其形成后在文件管理系統內部的所有加工、傳輸、處理過程進行管理,必須留下必要的背景信息以維護文件的完整性、可讀性和真實性。少數民族語言電子文件的前端控制和全程管理需求需要嵌入到民族地區(事務)電子文件管理當中,例如必須認識到少數民族語言電子文件在民族地區和民族事務管理當中的獨特價值,從制度層面將其納入到必須歸檔保存的范圍;另外,應用軟件一定要考慮到多語言處理的需求,支持Unicode,而不能僅僅支持GB2312,以避免多語種共享時可能出現的惡亂碼現象;其次,要盡可能選擇技術水平較為成熟的應用軟件,文件存儲的格式要盡可能選擇標準格式或者使用較為廣泛的格式等等。
第二,按照統一的制度和標準,進行“單元歸檔”。單元歸檔時需要對電子文件各方面的狀況進行全面鑒定,首先需要判斷電子文件的保存價值,根據電子文件保管期限表的要求設定保管期限;其次需要判斷電子文件信息的真實性、完整性、可讀性以及文件存儲載體的性能情況等。經過鑒定環節以后,需要保存的電子文件再根據不同的密級分別保存在不同的系統當中,或者進行脫機保存。同時,要根據標準對電子文件進行元數據著錄。少數民族語言電子文件的管理需求在“單元歸檔”中也應當體現,例如非通用軟件產生的電子文件要將電子文件和產生它的軟件一同歸檔;少數民族語言電子文件如果有國家通用語言文字版本,必須將兩種版本的文件同時歸檔等等。
第三,基于統一的分布式網絡,進行“集成歸檔”。“集成歸檔”是從單元歸檔后的電子文件中將少數民族語言電子文件進行映射和復制,并提交給分布式網絡存儲節點進行歸檔保存的過程。“集成歸檔”基于電子文件分布式共享網絡,該網絡是由分布式數據庫構成,各個節點的數據庫相對獨立運行,但是邏輯上又屬于同一個系統,可以支持對電子文件的全局檢索。“集成歸檔”意味著將大量的少數民族語言電子文件從各級各類檔案館集中到同一個數據庫當中進行保存,因而必須解決好編碼轉換、元數據整合、格式轉換等問題。除了對現有電子文件進行信息集成之外,通過“前端控制”使電子文件各類技術參數趨于標準化,是提高電子文件歸檔質量,降低集成歸檔工作量的重要保障。“單元歸檔”更側重于保存,“集成歸檔”更側重于服務,因此“集成歸檔”的電子文件只限于已經公開的少數民族語言電子文件,涉密電子文件仍保存在原地點,等解密公開后再進行“集成歸檔”。
第四,基于統一的支撐體系,提供跨地區和跨語言的“集成服務”。除了要建立分布式共享網絡之外,集成管理體系中還要建立不同語種的“可讀性支持中心”和“共享性支持中心”,提高系統的整體績效,避免重復建設。例如藏語電子文件分布于我國的西藏、青海、四川、甘肅、云南等省區的檔案館中,可以在西藏建立“藏語電子文件可讀性支持中心”,收集并保存所有與藏語言信息處理相關的技術標準、系統軟件和應用軟件,配備專業的服務力量,除了為西藏自治區服務以外,也可以為其它省區的藏語電子文件提供讀取、遷移、仿真等可讀性支持服務。此外,目前計算語言學研究當中,機器輔助翻譯大多基于大規模雙語對齊語料庫,每個省區獨立為每個語種建立對齊語料庫是不經濟的,也不現實的。因此,可以從全局規劃,如在西藏建立“漢語-藏語雙語對齊語料庫”,在內蒙古建立“漢語-蒙古語雙語對齊語料庫”,在新疆建立“漢語-維吾爾語雙語對齊語料庫”、“漢語-哈薩克語雙語對齊語料庫”和“漢語-柯爾克孜語雙語對齊語料庫”等,這些語料庫除了為本省區的電子文件管理提供服務以外,也向其他省區使用同一語種的電子文件提供機器輔助翻譯服務。
3.支持性活動
支持性活動是價值鏈中不直接參與價值創造,而是為創造價值的基本活動提供支撐的活動,離開了支持活動,基本活動的效果也會受到影響,甚至無法實現。中國少數民族語言電子文件集成管理的支持性活動主要有:第一,基礎設施建設。少數民族語言電子文件集成管理在前端需要有少數民族語言文字信息處理技術的支撐,特別是少數民族語言電子文件管理的相關軟件系統較為缺乏。后端的集成管理平臺必須以互聯網為基礎,必須保障各個分中心之間的網絡通暢。基礎設施建設與國家信息化建設總體規劃相適應,按照循序漸進原則逐步推進。第二,制度體系建設。少數民族語言電子文件集成管理是涉及多個領域的綜合性問題,必須有一系列制度作為保障,主要有民族區域自治、少數民族語言文字管理、民族地區檔案管理、電子文件管理等領域的法律、規章、標準和其它規范性文件。第三,組織架構建設。少數民族語言電子文件集成管理需要在國家現有的檔案管理體制的基礎上,構建起跨地區、跨語言的綜合性管理機制,成立統一的協調和管理機構,配備相關的技術和管理人員,同時研究各個民族地區相關人才的保障問題。第四,管理流程建設。少數民族語言電子文件集成管理意味著管理模式從最前端就要考慮到全國共享的問題,管理流程自然會與傳統環境下的管理流程有所不同。特別是涉及到要將少數民族語言電子文件導出復制后集成歸檔,原始電子文件與集成歸檔后的電子文件之間的關系協調也需要流程來保障。
1.架構模型
根據上述分析,建立中國少數民族語言電子文件集成管理的架構模型如下:

圖1少數民族語言電子文件集成管理的架構模型
如圖1所示,中國少數民族語言電子文件集成管理體系的架構模型整體上分為三個部分:價值分析、基本增值活動、支持性活動。其中,基本增值活動包括前端控制、單元歸檔、集成歸檔和集成服務四個環節,由于這四個環節整體上體現了少數民族語言電子文件管理的生命周期,因此,本文將基本增值活動的過程稱之為中國少數民族語言電子文件集成管理的“生命周期”。支持基本增值活動的因素主要有基礎設施、制度體系、組織架構和管理流程,統稱為“支持性活動”。
2.研究體系
根據圖1所示的架構模型,少數民族語言電子文件集成管理研究主要關注以下問題:
第一,少數民族語言電子文件管理需求調研與建模。基于電子文件在檔案、政治、文化、經濟、科研等領域應用現狀,從國家層面上確定少數民族語言電子文件集成管理的戰略定位。在大規模實際調研的基礎上,分析和總結少數民族語言電子文件管理的基本需求和特殊需求,提出系統性的需求模型和功能需求清單。
第二,少數民族語言電子文件集成管理的戰略規劃。以檔案資源開發利用理論、文件生命周期理論、電子文件管理理論、跨語言信息管理等理論為基礎,借鑒歐盟墨卡托網絡的成功經驗,以多元一體思想為指導思想,按照系統集成理論的基本原理,對少數民族語言電子文件管理體系進行系統分析,構建基于價值鏈的中國少數民族語言電子文件集成管理架構模型。
第三,少數民族語言電子文件集成管理的生命周期。從前端控制、單元歸檔、集成歸檔和集成服務四個階段全面分析少數民族語言電子文件集成管理的主要環節:前端控制階段重點關注少數民族語言電子文件編碼方案、存儲格式、數據結構的標準化問題;單元歸檔重點關注少數民族語言和國家通用語言的雙語著錄、非通用軟件和硬件系統的歸檔留存等問題;集成歸檔階段主要關注基于分布式數據庫的電子文件存儲體系、可讀性支撐中心、信息安全等問題;集成服務主要關注少數民族語言電子文件跨媒體數據集成、基于雙語對齊語料庫的少數民族語言電子文件機器輔助翻譯系統、少數民族語言電子文件跨語種信息共享、集成服務平臺建設等問題。
第四,少數民族語言電子文件集成管理的支持體系。分析與集成管理生命周期所對應的基礎設施建設、法律制度體系、組織機構設置和管理流程設計等問題。
第五,少數民族語言電子文件集成管理的推進策略。分析在中國民族地區當前的社會環境下利用各類資源逐步推進集成管理體系建設的規劃先行策略、分類管理策略、階段推進策略等問題。
少數民族語言電子文件集成管理是一個涉及多領域、多部門的綜合性、復雜性問題,要滿足真實性、完整性、可讀性、安全性保障的基本任務,還要滿足可獲性支持、可懂性支持、專業化管理等特殊需求,實現“多元性”需求和“一體化需求”的平衡。基于邁克爾-波特的“價值鏈”理論,本文構建了中國少數民族語言電子文件集成管理體系的架構模型。模型整體上分為價值分析、基本增值活動、支持性活動三個部分。其中,基本增值活動包括前端控制、單元歸檔、集成歸檔和集成服務四個環節,稱為少數民族語言電子文件管理的生命周期;支持性活動主要有基礎設施、制度體系、組織架構和管理流程四個方面。基本活動和支持活動相互配合,共同完成少數民族語言電子文件集成管理的各項任務,實現管理的各類價值。
[1]中國教育部網站,http://www.moe.edu.cn/ edoas/website18/level3.jsp?tablename=1266&infoid=4795
[2]戴慶廈等編,中國各民族文字與電腦信息處理[M].北京:中央民族學院出版社,1991.
[3]趙生輝.中國少數民族語言電子文件管理初探.檔案學通訊[J].2011(2):61.
[4][美]邁克爾-波特著,陳小悅譯,競爭優勢[M],北京:華夏出版社,1997.
[5]趙生輝.中國少數民族語言數字信息分布式共享研究.情報資料工作.2011(3):57-61.
[6]趙生輝.中國少數民族語言電子文件管理的戰略思考.中國檔案.2011(5):p34-36.
[7]費孝通編著.中華民族多元一體格局[M].北京:中央民族學院出版社,1989.
[8]馮惠玲,劉越男等著.電子文件管理國家戰略[M].北京:中國人民大學出版社,2011.
[9]劉家真等著.電子文件管理理論與實踐[M].北京:科學出版社,2007.
[10]李寶山,劉志偉著.集成管理——高科技時代的管理創新[M].北京:中國人民大學出版社,1998.
[11][德]奧古斯特-威廉·希爾著.李清,張萍譯.集成的信息系統體系結構(ARIS)——經營過程建模[M].北京:機械工業出版社,2002.
[12][美]S·塞里著.關春英譯.分布式數據庫原理和系統[M].北京:水利電力出版社,2005.
[13]俞士汶著.計算語言學概論[M].北京:商務印書館,2007.
作者單位:西藏民族大學管理學院
國家社科基金項目“多民族語言信息資源跨語種共享策略研究(14BTQ008)”;中國博士后科學基金項目“多民族語言信息共享域的架構模型與規劃方法研究(2014M561634)”;中國博士后科學基金特別資助項目“少數民族語言信息資源輔助閱讀系統原型設計與開發研究(2015T80539)”。