999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

民國檔案數字人文服務平臺建設思路研究

2021-08-30 02:35:49陳宇
北京檔案 2021年8期

摘要:明確數字人文及數字人文服務平臺的內涵,解析目前數字人文服務平臺建設中存在的誤區。通過提煉民國檔案數字人文服務平臺建設的價值目標,確立民國檔案數字人文服務平臺的功能定位,進一步(從完善跨學科研究體系、構建檔案整理開發自動化體系、優化知識服務體系、加強網絡文獻資源采集和信息組織等四個方面)提出民國檔案數字人文服務平臺的建設思路。

關鍵詞:開放利用 民國檔案 數字人文服務平臺

新《檔案法》把創新檔案信息資源共享服務平臺建設作為推進檔案開放利用體系和開放利用能力現代化的重要內容,提出了“推動檔案數字資源跨區域、跨部門共享利用”的目標要求。民國檔案資源建設是檔案信息資源建設的重要組成部分,是提升民國檔案服務能力的一項基礎建設,也是當前和今后民國檔案工作的一項重點任務。

一、數字人文及數字人文服務平臺的內涵

數字人文是借助數字科技進行人文研究的新型跨學科研究領域,從技術角度看,其熱點主題有文本挖掘與可視化、語義網技術兩類。前者又可以分成三個子主題:文獻計量與知識圖譜,自然語言處理、機器學習與可視化,文本挖掘、可視化與地理信息系統(GIS)技術。[1]空間人文通過抽取文獻中不同粒度的地理位置、人口、自然等信息,利用GIS重現原文對地點的描述,或與現實地理位置關聯,為歷史、考古等研究提供支撐。文本挖掘則是沿著“從真實的數據到結構化數據,再到有用的知識”這條路,通過標記數據或發現數據隱式結構,將文本數據轉化為多維知識。[2]

數字人文服務平臺本質上就是基于數字人文技術構建的一個聚合數據資源、數據工具、數據服務的知識共享平臺、內容開放平臺。通過對國內數字人文項目的考察,當前數字人文服務平臺主要實現的功能包括六類:一是文本挖掘。利用文本挖掘、關聯數據等技術對文本內容信息與外部特征進行捕獲與收集,分類組織、定量分析并提供多種檢索途徑;二是可視化分析。基于可視化工具將地理空間與時間空間的相互疊加,以圖表、詞云、動圖等形式勾勒地理空間和特定歷史事件、事物或數據間的聯系,形成路線圖、演進圖、沿革圖、遷徙圖等可視化圖表[3];三是場景模擬與復原。通過對文獻記載、圖像、音視頻資料進行分析、挖掘,運用計算機建模、關聯數據等技術將相關元素集中分析提煉,立體、多維、生動的還原各類歷史場景;四是語料庫利用。挖掘口述文獻、文本文獻中的大量地名、機構、人物等名稱,建立人名庫、地名庫、地理名詞表、機構名錄等規范數據庫,提供多途徑檢索服務;五是用戶參與。對開放瀏覽的數字化資料提供自由創建標簽、百科辭典編輯、數據審核眾包等互動參與式的利用服務;六是研究支持。匯集必要的背景知識、參考數據,以及歷史年表、歷史地圖、字典詞典等研究工具。

二、數字人文服務平臺建設面臨的誤區

一是單學科利用需求大于社會公眾需求,導致數字人文服務平臺的價值迷失。數字人文服務平臺建設的實質是以實現和維護公眾權利為目標,通過匹配和實現公眾表達資源需求、利用資源、參與建設的權利,推動數字資源的合理配置和有效利用。但目前數字人文服務平臺建設一方面把某一學科利用需求作為平臺建設的核心價值需求,把建設中的主要資源和精力都用于學科內部“表淺化的檢索”,忽視學科間、數據間聯結的建立,不足以提供增加新認知的結構性信息。另一方面,平臺匯集了大量面向公眾開放的數字資源,但在運行方式上,開放程度普遍不高,多數僅限內部使用,實際并沒有讓社會公眾享受數字技術福利、降低查找文獻資料的成本。

二是數字化外包替代多元參與,導致數字人文服務平臺的協作格局沒有形成。隨著眾包、共享等服務功能的出現,平臺資源的提供者由單一的保管機構向個人、企業、團體等多中心轉變,數字人文服務平臺的建設主體不僅是人文社會科學學者、資源保管機構,還要依托群體智慧和用戶的協同參與。“(網絡世界資源交換群體)以社區論壇為活動中心,以網絡云盤作存儲場所,利用微博、微信群傳遞消息,通過這些形式發布的資源具有公開、免費和即時性。”[4]然而,由于部分資源涉及版權糾紛,存在大量繁復的甄別工作,并且數字化外包已規模化、專業化,使國內網絡信息資料的采集與保存工作沒有獲得足夠的重視,從而忽略了豐富的網絡文獻資源在數字人文服務平臺中的作用,漠視了網絡資源的集聚效應實際傳達出的社會公眾對自由、平等、開放數字人文服務平臺建設的公共需求。結果不僅會導致協同合作的數字人文服務平臺建設難以持續,也會因為缺乏用戶參與和多主體參與而缺乏認同,演變成閉門造車式的自娛自樂。

三是被動開放重于用戶需求,導致數字人文服務平臺建設的路徑本末倒置。目前數字人文服務平臺一方面把主要精力放在新功能的豐富和實驗上,對文本標引、詞頻統計、語義標記、文本對比、影像文字辨識等基礎功能、工具的升級更新研究不足,使用戶的參與度、參與數只是平臺功能自我驗證的實驗數據。另一方面,平臺旨在滿足用戶個性化的知識需求,但用戶需求又無法影響數字資源供給的范圍和水平,由此導致平臺數據質量不高、數據間缺乏關聯等不足,會不斷帶來新的功能訴求。因此,只有把用戶需求作為數字人文服務平臺建設的基本,通過優化知識服務模式,形成資源共建共享的高效分享機制,才有可能從根本上實現不同功能的合理實現與劃分。[5]

四是項目式舉措多于科學規劃,導致數字人文服務平臺建設的穩定保障不足。目前數字人文服務平臺的原始語料庫多是各類社科項目數據庫建設成果的衍生,具備學術創新,但由于多數屬于專題式、局部式、個人式的學術積累,缺乏宏觀的統籌設計和科學規劃,往往出現課題結項后數據庫關閉或停止更新維護,可持續性不足的情況。當前,一方面數據庫建設質量、規模的參差不齊,分類體系、功能設置的不一致,銜接溝通、配合協調的缺乏,使得單一數據庫成為資源“孤島”,難以構建縱向貫通、橫向集成的數字人文服務平臺資源庫,實現量化研究和質性研究的對話;[6]另一方面部分平臺建設缺乏數字人文和傳統研究方式的融通。人文學科具有特定的屬性,這些屬性對于數字人文的功能要求實際超出了文本間關聯的發現,同時也對平臺設計者、維護者的素質提出了更高的要求。

三、民國檔案數字人文服務平臺的價值目標

新《檔案法》不僅對“推進電子檔案管理信息系統建設,有條件的檔案館應當建設數字檔案館,國家推動檔案數字資源跨區域、跨部門共享利用”的主要任務做了明確部署,也深刻指出數字人文服務平臺的建設既包括檔案開放范圍、利用形式,還包括平臺建設的內涵和基本原則。民國檔案數字人文服務平臺理應是工具價值和獨立價值兼具的系統平臺。

共享共建。在民國檔案數字人文服務平臺建設中必須堅持公眾的主體地位。要樹立檔案活態保護、動態利用的服務理念,一切以維護公眾利用檔案的合法權益為根本,變“被動開放”為“主動開放”,最終走向“合作開放”,促進民國檔案開放利用制度化、規范化、程序化,在學術科研、社會服務等方面發展更加廣泛、更加充分、更加健全的共享共建機制。[7]

精準公平。一方面,檔案部門絕不能只以“資源提供者”的角色參與到數字人文浪潮中,因為只有以公共服務部門為主導的數字人文項目才最有可能實現數字人文成果面向社會公眾的免費開放。另一方面,民國檔案數字人文服務平臺的建設也是檔案資源重新組織、配置的過程,必然面臨各方主體的不同利用需求,只有建立精準的用戶需求調查機制、公平的檔案資源利用機制,才能有效化解供需矛盾,讓檔案整理編研、開放利用的成果更精準地惠及每一名用戶,保障普通用戶平等參與共建過程,構建資源匹配精準、機會開放公平的數字人文服務平臺。

多元活力。在當前學科劃分細化、學者跨界頻繁、學術交流深化、學術原創精神不斷拓展、學術視野更趨開闊的條件下,民國檔案數字人文服務平臺既要確保公共服務能力的最大化,堅守“為黨管檔、為國守史、為民服務”價值體系,確保基本價值功能不受侵害,也要鼓勵社會多元,理解用戶多樣化和個性化的需求。特別是在數字人文服務功能的設置上,及時把合理的個性化訴求轉化為服務功能的創新,讓用戶和網絡文獻資源充滿生機活力,使民國檔案收集與開放保持動態平穩狀態。[8]

安全有序。民國檔案數字人文服務平臺的宗旨是確保檔案開放有序、檔案數據安全。面向社會化網絡的平臺建設并不是完全沒有潛在風險,因此要在共同遵循規則秩序的前提下將檔案安全風險控制在有限范圍內,用戶矛盾糾紛可以在統一的解決機制下獲得較快解決。[9]首先需要平臺具備完善的管理系統,依靠身份管理、誠信管理、知識管理彌合由于信息不對稱、關系聯結松散帶來的風險形成;其次需要構建網絡環境下民國檔案資源建設的標準體系,包括收集、流轉、存儲、利用等方面的技術標準,以及檔案元數據標準;最后需要建立知識產權保護機制,運用數字版權管理技術,全過程保護平臺知識貢獻者的正當權益,防止知識產權的濫用。

四、民國檔案數字人文服務平臺的功能定位

民國檔案數字人文服務平臺是以滿足和維護公眾需求為核心,發揮各類主體作用,針對現有檔案開放利用中的不足,創新開放形式,強化服務功能,提高數字化水平,促進社會共享,推動民國檔案工作緊跟時代改革創新。[10]《“十四五”全國檔案事業發展規劃》鼓勵加大檔案資源跨領域、跨區域、跨層級整合力度,推動檔案數字資源跨區域、跨部門共享利用,具有很強的時代創新性和戰略指導性,為我們深刻理解民國檔案數字人文服務平臺在促進民國檔案開放利用中的功能定位提供了引導作用。[11]

一是推進檔案治理能力現代化的先行示范。民國檔案開放利用體系在形式上體現為一系列規范機制的檔案管理制度,內容涉及保管、修復、整理、信息化、編研、利用等六個方面,重點在于利用規則、開放形式、服務功能、協作方向、數字化內容、信息安全的完善,實質是通過運用民國檔案資源為國家機關和社會公眾開展有關問題研究提供文獻支持和便利,適應檔案管理體系和檔案治理能力現代化要求,實現民國檔案事業走向依法治理、走向開放、走向現代化。民國檔案開放利用能力,就是運用上述各項檔案管理體制機制推進民國檔案開放利用的水平和績效。[12]因為民國檔案開放利用能力反映了開放利用行為的水平和質量,是對創新模式有效性、合理性和長期性的直觀度量。

二是提升民國檔案開放利用實效的知識中心。民國檔案的開放利用由于經過鑒定審查、劃控、審核等流程,與公共需求存在一定時間上的延滯。隨著近代史、抗戰史研究的日益精細化,對外交流合作的日益國際化,公眾閱文查檔的日益頻繁化,在加快民國檔案開放范圍擴大、開放方式轉變、利用形式多樣的過程中,必然面臨知識觀念深刻變化、協作方式深刻調整、檔案需求深刻變動等現實難題,能否正確處理好民國檔案事業發展與社會共享,數據化、全文化與檔案保護,用戶需求與檔案信息安全,需求增長與服務供給不足等開放利用問題,這既是構建民國檔案開放利用體系的基礎,也是提升民國檔案開放利用能力的前提。[13]

三是民國檔案數字化成果集中展示的創新基地。民國檔案數字化建設,既包括發展檔案數字化工作,即數據信息挖掘、檔案史料眾包、檔案文件級目錄著錄、檔案信息安全等基本服務功能[14],也包括網絡文獻資料的采集、檔案編研數字化出版。這些既是民國檔案數字人文服務平臺的核心內容,也是民國檔案開放利用的基礎。

四是強化社會協同合作的共享平臺。其基本方向:一是以跨學科合作為利用方式。要實現民國檔案數字人文服務平臺的建設,必須建立一個以資源互通為基礎,以多維度協作為特征的多元統一的數字人文服務平臺結構。促進與博物館、地方館、科研院校等主體廣泛協作的制度化發展。二是資源主體趨于多元化,檔案保管機構必須與各種網絡文獻資源一起形成互補網絡,在共同開放利用的基礎上形成信息的重組與增值,共享檔案資源,并使各方共同獲益。[15]三是檔案資源向社會的回歸。檔案資源的開放利用過程不再是自上而下、由內而外的,而是回歸社會和網絡之中成為服務者。

五、民國檔案數字人文服務平臺的建設思路

一是要完善跨學科研究體系。跨學科研究既指在平臺建設中加入如文獻學、民俗學、人類學、經濟學、教育學、敦煌學等不同學科領域的方法和數據,也指在已有的海量文本數據挖掘中采用不同學科視角多維度、多粒度的提取文本數據中的知識信息。跨學科研究體系是推進民國檔案數字人文服務平臺建設的基本保障,也是影響其建設質量的制度基礎。

二是要構建檔案整理開發自動化體系。自動化體系主要是指實現檔案整理開發自動化的技術保障和功能規則制度。檔案的整理開發如果缺乏實現識別檢錯、主題提取、自動分類等技術工具僅依靠人工進行文本字符的數字化,就很難充分發揮檔案資源的研究支持功能。首先,要建立民國檔案文獻語料庫,利用抽取民國公文、職官、機構、軍事、人名、區劃等,與異名別稱規則、分類規則、斷句標點規則、書法字體、圖片唱片等形成豐富的語料庫,為實現規范數據的重用和共享構建基礎;其次,要運用語料庫實現民國檔案整理與開發自動化。通過基數龐大的語料庫,組織編纂期刊論文索引、職官機構索引、卷宗主題索引等各類索引,構建起語料庫之間的元數據交叉聯系,并結合語言學方法,實現計算機的輔助識別、自動校勘、自動斷句,從而實現成果挖掘和知識增值功能。[16]

三是要優化知識服務體系。首先,要提升知識服務模式的共建化水平,平臺可以打通館藏資源和社會資源、工作人員與檔案館、讀者與工作人員之間的聯系,而且挖掘出廣大社會讀者的知識資源;其次,轉變人員服務角色,構建多主體協同供給機制。借助平臺可以實現知識資源的交換,實現用戶參與與知識貢獻的互動關系,逐步形成檔案館主導,多主體協同共建的知識聚合格局。[17]

四是要加強網絡文獻資源采集和信息組織。首先要統一網絡文獻資源采集的標準規范。針對目前網絡文獻資源標引不規范導致難以二次開發利用的問題,探索建立“垂直典藏、專題建設、深層檢索”的元數據加工制度,實施分類管理;[18]其次構建網絡文獻資源的信息組織機制。檔案館作為知識的存儲機構,可以承擔對網絡文獻資源的采集與信息組織分析機制的探索,制定網絡文獻資源采集、編目、管理工作規范。引導社會公眾參與對網絡文獻資源的信息抽取、知識組織等環節,引入網絡文獻資源觀察評估制度,編制網絡文獻資源的年度報告書,逐步建立起一個嵌入民國檔案數字人文服務平臺,與既有檔案資源數據相互補充的互聯網資源服務體系;最后,要建立網絡文獻資源采集的激勵機制。制定激勵公眾用戶參與網絡文獻資源發展的管理策略,運用欣賞激勵、獎勵激勵,鼓勵用戶在學習、交流中完成網絡文獻資源的轉移、留存和流動。[19]

注釋與參考文獻

[1]王東波.面向知識挖掘的平行句法語料庫構建研究[M].南京:南京大學出版社,2019:12-31.

[2張超,韓家煒等.海量文本數據的多維挖掘[M].北京:機械工業出版社,2020:1-10.

[3]王華.晚清民國華僑文獻整理與研究[M].廣州:廣東人民出版社,2021:448-459.

[4]陳宇.應急保障視角下對網絡資源“集聚效應”的重新審視[J].高校圖書館工作.2020(5):50.

[5]程靜.國內外數字人文服務平臺建設現狀及思考[J].圖書館學研究. 2020(2):41-43.

[6]周耀林,趙躍等.非物質文化遺產檔案資源建設“群體智慧模式”[M].武漢:武漢大學出版社,2020:272-276.

[7]陳果.面向網絡社區的領域知識聚合研究[M].北京:科學技術文獻出版社, 2019:30-35.

[8]賀晨芝,張磊.圖書館數字人文眾包項目實踐[J].圖書館論壇. 2020(5):6-8.

[9]左娜,張衛東.面向數字人文的檔案資源整合模式構想:解構與重組[J].檔案學通訊. 2020(3):33-34.

[10]唐燕,劉小榕等.智慧圖書館空間再造與數字人文服務創新研究[J].圖書館. 2020(5):74-76.

[11]劉舒妍.以法治化促進檔案治理現代化[N].中國檔案報. 2020-12-10(3).

[12]朱麗梅.檔案信息化建設的績效評價研究[D].華南理工大學,2014:24-27.

[13]李明華.在全國檔案局長館長會議上的工作報告[J].中國檔案. 2019(4):25-28.

[14]馬振犢,王俊明等.檔案數字化前整理工作的實踐研究[J].創新:檔案與文化強國建設——2014年檔案事業發展研究報告集. 2014:93-100.

[15]馬費成.信息管理與信息系統研究進展第2輯[M].武漢:武漢大學出版社,2017:496-498.

[16]王雅戈著.古籍計算機自動索引研究以民國農業文獻自動索引為例[M].蕪湖:安徽師范大學出版社, 2013:2-6.

[17]尉遲文珠.試論我國高校圖書館知識服務模式構建[D].天津師范大學,2007:27.

[18]李曉明,馬寧寧.國家圖書館網絡信息采集的實踐與發展[J].網絡資源采集與數字資源長期保存學術研討會論文集. 2013:15-17.

[19]陳鶴陽.眾包平臺用戶持續知識貢獻行為研究[M].2020:164-166.

作者單位:中國第二歷史檔案館

主站蜘蛛池模板: 亚洲综合专区| 色综合狠狠操| 91久久天天躁狠狠躁夜夜| 国产精品偷伦在线观看| av手机版在线播放| 国产欧美视频综合二区| 丁香五月激情图片| 免费 国产 无码久久久| 国产色网站| 亚洲天堂网在线播放| 国产情精品嫩草影院88av| www亚洲天堂| 亚洲成人福利网站| 在线观看免费黄色网址| 美女一级免费毛片| 国产天天色| 成年人视频一区二区| 天堂岛国av无码免费无禁网站 | 国产91小视频| 国产成人无码综合亚洲日韩不卡| 特级aaaaaaaaa毛片免费视频| 亚洲国产成人精品一二区| 欧美国产菊爆免费观看 | 国产亚洲欧美在线人成aaaa| 亚洲AV无码久久天堂| 国产SUV精品一区二区| 992Tv视频国产精品| 秋霞一区二区三区| 精品久久久久久中文字幕女| 久久毛片免费基地| 国产欧美日韩综合一区在线播放| 中文字幕色在线| 日韩中文字幕免费在线观看| 伊人色天堂| 四虎成人精品在永久免费| 粉嫩国产白浆在线观看| 全色黄大色大片免费久久老太| 免费 国产 无码久久久| 国产簧片免费在线播放| 一本色道久久88| 亚洲国产欧洲精品路线久久| 欧美影院久久| 人与鲁专区| 一级福利视频| 在线国产三级| 亚洲成肉网| 亚洲第一天堂无码专区| 理论片一区| 又污又黄又无遮挡网站| 欧美性精品不卡在线观看| 国内精品自在自线视频香蕉| 91精品亚洲| 亚洲欧美不卡视频| 伊人色婷婷| 三上悠亚一区二区| 在线观看国产黄色| 国产福利免费视频| 国产美女无遮挡免费视频| 中日韩欧亚无码视频| 91无码网站| 成年A级毛片| 三级欧美在线| 亚洲国产一区在线观看| 欧美日韩国产在线观看一区二区三区 | 99人体免费视频| 亚洲第一成人在线| 四虎影视国产精品| 亚洲熟妇AV日韩熟妇在线| 色欲国产一区二区日韩欧美| 日韩在线欧美在线| 四虎国产在线观看| 88国产经典欧美一区二区三区| 国产天天射| 亚洲国产日韩一区| 日本一本正道综合久久dvd | 99精品伊人久久久大香线蕉| 精品人妻无码区在线视频| 精品91在线| 亚洲精品视频免费| 亚洲精品手机在线| 婷婷开心中文字幕| 亚洲无限乱码|