999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

檔案文化智慧數據資源建設

2022-02-22 23:13:03郝偉斌王君儀段燕鴿
檔案管理 2022年1期

郝偉斌 王君儀 段燕鴿

摘? 要:中福公司作為中外合資企業,在中國經營期間留下了極為珍貴的檔案資料。中福公司檔案作為價值豐富的歷史文化檔案資源,國內外學者已對其開展不同層次與角度的研究,獲得了豐富的研究成果。國家文化大數據體系建設工作的開展與檔案數字化工作逐漸興起,基于此,以河南省檔案館主導的中福公司檔案整理與開發項目為契機,梳理分析智慧數據為中福公司檔案智慧數據資源建設帶來的契機以及中福公司檔案智慧數據資源建設可行性,并在此基礎上以工程化與系統化的模式框架為基礎,構思包含數據獲取、數據轉化、數據關聯與數據應用的中福公司檔案智慧數據資源建設技術路徑。

關鍵詞:中福公司;智慧數據;檔案文化資源;資源建設

Abstract: As a Sino-foreign joint venture, Zhongfu Company has left a very valuable Archives during its operation in China. As a valuable historical and cultural Archives resource, scholars at home and abroad have carried out different levels and angles of research, and obtained rich research results. Based on this, the development of the national cultural big data system construction and the digitalization of Archives are gradually emerging, taking the Archives arranging and development project of Zhongfu Company, which is led by henan Province Archives, as an opportunity to sort out and analyze the intelligent data for the construction of the Archives intelligent data resources of Zhongfu Company and the feasibility of the construction of the Archives of Zhongfu Company, and on this basis, based on the model framework of engineering and systematization, the concept includes data acquisition, data transformation, Data association and data application of Zhongfu company file intelligent data resource construction technology path.

Keywords: Zhongfu company; Smart data; Archival cultural resources; Resource construction

智慧數據作為數據科學領域的新概念,通過挖掘用戶需求,依托細粒度的知識組織與表示,以語義化及可視化為進階,拓展數據知識化應用,形成數據的智慧化高階價值呈現形態。隨著中福公司檔案整理與開發項目的逐步推進,檔案中蘊含的潛在價值逐漸得以開發與顯露,有必要針對中福公司檔案已有的數字化基礎融合智慧數據理念與技術開展進一步探究,通過本文研究,將理論與實踐相結合,以中福公司檔案智慧數據資源建設為例,以期助力于檔案文化資源建設理念創新,對于檔案文化智慧數據資源建設工作起到進一步推動作用。

1 智慧數據處理是檔案文化資源建設的新手段

1.1 激發檔案文化隱性價值。檔案智慧數據作為對檔案實體深入挖掘得出的高階價值呈現,在檔案文化資源建設工作中引入智慧數據技術與理念,智慧數據自身所具備的價值增值性使得檔案資源隱性價值——檔案數據價值得以充分開發。

1.2 細化檔案文化數據粒度。檔案粒度是指在不同角度與層次對檔案資源細化后產生的數據元素基本構成單元。智慧數據所應用的知識發現技術,可通過數據挖掘、機器學習、深度學習等方式展開自動分析,快速洞察細粒化數據的隱藏關系,對數據進行預處理,實現知識單元離散化、細粒度知識組織與揭示服務的精準化、語義關系豐富化等。將智慧數據相關技術理念融入檔案文化資源建設,獲取合適的檔案數據分化理念,推進檔案數據粒度細化,形成檔案數據結構中相對獨立的、具有完備知識表達的、最細粒度化的概念模型,提高檔案數據知識主體構建工作的效率與精確率,隨之通過語義豐富化,實現數字資源間語義關系的建立和擴展,促進大規模檔案資源之間的關聯融合,提高檔案文化資源的可用性和共享性。

1.3 加速檔案文化智慧發展。在技術方面,智慧數據技術作為數字化、數據化、智慧化等階段關鍵技術的融合,包含數據管理技術、數據安全技術、語義化技術、可視化技術等,可以促進檔案行業充分利用數據挖掘、分析、關聯等適用性新型技術、智能化設備與數字化平臺,豐富檔案文化資源自身語義,實現數字檔案之間語義關系的建立,推進檔案資源向數字化—數據化—智能化轉變。在思維方面,智慧數據所包含的數據意識與態度、數據處理思維、智能平臺化思維、價值取向等數據素養,能夠促進檔案工作思維泛化,推動檔案文化資源精細化建設,不斷激發檔案文化資源之中的巨大價值,加速檔案文化領域的智慧化發展。

2 中福公司檔案智慧數據資源建設可行性分析

2.1 自身價值。中福公司是西方列強于中國近代時期在華投資創辦的一家大型外資企業,在中國經歷了福公司獨資經營、福中總公司合營、中福兩公司聯合辦事處三個階段,主營煤礦,兼營鐵礦、鐵路、桐油、特種礦產品等業務,其活動范圍涉及北京、天津、山西、河南、湖北、湖南等地區。中福公司檔案作為英國福公司在中國從事政治、經濟、教育等活動直接形成的具有保存價值的歷史記錄,分散保存在河南省檔案館、湖北省檔案館、重慶市檔案館等地區,具有內容豐富、載體多樣、類型豐富、資源地位顯著、史料內容充足、研究價值獨特等特點。[1]其作為一座檔案的“富礦”,能夠為尋求史實、開展學術研究提供一手史料,為推進社會主義愛國教育提供基本材料門徑。[2]

針對中福公司檔案進行智慧數據資源建設,以用戶動態化、多元化、及時性的信息需求為中心,充分運用數據技術與智能技術,打造中福公司檔案智慧數據資源知識庫,是實現中福公司檔案文化價值、學術價值與教育價值最大化體現的重要途徑。

2.2 基礎優勢。河南省檔案館對中福公司檔案進行整理與數字化開發已取得較為顯著的成果,為中福公司智慧檔案數據資源建設的開展打下一定的基礎。一方面,數字化處理與加工,依托中福公司檔案實體形成了較為完備的數字化資源。另一方面,河南省數字檔案館建設,為中福公司檔案智慧數據資源建設提供了智能化技術支撐與數字化環境優勢。

2.3 理論支撐。2018年,中國人民大學錢毅教授首次提出“三態兩化”理論。“三態”指的檔案對象管理空間的模擬態、數字態與數據態,模擬態注重維持實體有序與存貯空間安全,數字態注重保證數字態對象可讀性,數據態注重維護數據態對象的可理解性。[3]錢毅教授強調,以維護語義完整為主的檔案數據態保存則成為亟須關注的重點問題。

中福公司檔案現如今已通過派生方式實現存量檔案數字化、完成數字共享平臺建設。同時,編纂了《中福公司檔案史料匯編》,拍攝了《他們特別能戰斗》文獻紀錄片。基于信息化深入發展、數據驅動普遍出現、檔案管理對象維度收縮、三態并存等社會發展情形,具備了依據自身深度開發利用的條件和需求,推進中福公司檔案智慧數據資源建設的條件。

3 中福公司檔案智慧數據資源建設模式

3.1 工程化項目驅動。“建”的目的在于“用”。建立檔案文化智慧數據資源的工程化建設模式,采取過程性、流程化管理策略,可鞏固階段性建設成果,穩步推進建設項目的實施。

針對中福公司檔案史料匯編項目的智慧數據資源建設工作,融合項目工程化思想,應明確項目整體目標,定位資源建設需求。以項目需求為導向,把控建設節點以確保建設目標達成的準確性和資源建設的完整性。

3.2 系統化多方協同。(1)主體引領。一方面中福公司檔案智慧數據資源建設工作主體——河南省檔案館根據中福公司檔案特點,研究確定中福公司檔案資源建設方案,細化建設理念與工作節點;另一方面河南省檔案館積極推動多方協同,如檔案修復與數字化協同、翻譯與數據轉化協同、數據關聯發布與數據應用協同等,高效做好中福公司檔案智慧數據資源建設工作。

(2)多方協同。中福公司檔案智慧數據資源建設全過程不僅包括針對國內外中福公司檔案史料進行調研、收集的檔案資源準備工作,還包括館藏檔案的修復、分類和翻譯,以及中福公司檔案數字化加工和資源平臺建設等。河南省檔案館僅依靠自身力量難以高質量完成,需要研究、翻譯、修復、數字化、平臺搭建等多方技術團隊協同完成。[4]

從系統論的角度來看,中福公司檔案智慧數據資源建設以技術參與方為依托,對傳統檔案資源進行處理,將其以一定的層次與結構有機結合起來,作為該生態體系的“骨骼”,并以文化為題,賦予其獨特內涵,作為該生態體系的“血液”,使中福公司檔案資源在該體系中得以循環流動,共同構成系統協同性智慧數據資源建設模式。

4 中福公司檔案智慧數據資源建設技術路徑

智慧數據是信息資源的高級組織形態與表達方式,數據的結構化、語義化和關聯化程度相比現有信息資源組織程度更高,是數據科學理論體系中的新概念和信息資源建設的新方向。技術路徑包括數據獲取、數據轉化、數據關聯和數據應用四個方面。數據獲取方面,重點在于結構化轉換,構建中福公司檔案資源數據庫;數據轉化方面,通過五大概念模型細化中福公司檔案資源類別,形成細粒度的檔案知識元以構建檔案知識本體;數據關聯方面,依照中福公司檔案主題詞表,利用語義組織技術實現數據資源的深度標識;數據應用方面,實現主題檢索、知識推薦與智慧服務,以個性化、多樣化的形式呈現中福公司歷史圖景。

4.1 數據獲取。構建資源數據庫時所處理的資源對象可以大致分為非結構化資源、半結構化資源和結構化資源三種。構建中福公司檔案資源數據庫首先針對數字化后的中福公司檔案圖像進行OCR識別,結構化檔案資源,也就是分離檔案資源圖像層與文本層,增加其結構與內容的分離程度。文本主要由內容、結構組成,內容表述信息的語義含義,是文本的核心部分,也是獲取語義信息的重要來源;結構則用以支持語義的內容表述,從句法結構中有效地識別詞語,并建立文本概念之間的對應關系是獲取檔案資源語義信息的關鍵途徑。

4.2 數據轉化。“本體”一詞源于哲學領域,且長期以來存在著許多不同的用法。在計算機科學領域,其核心意思是指一種模型,用于描述抽象概念、概念的屬性及其之間的各種關系。檔案內容的語義集中體現在時間、空間、人物、組織和事件五大方面,借由“本體”的內涵引申至檔案實體,構建各實體所對應的抽象概念模型,針對中福公司檔案資源中包含的這五大數據屬性形成檔案知識本體。

在檔案文化資源本體構建過程中,人們難以做到對實體別名的窮舉式構建抽象概念模型,別名與目標對象之間缺少顯式的鏈接關系,實體名稱的變更將會導致檔案鏈之間的斷裂,最終造成檔案文化資源抽取時無法保證抽取結果的查全率。[5]

中福公司檔案時間跨度較大、語言體系混雜,至于中福公司檔案資源的本體構建則需要解決概念模型的統一表述問題。

在時間方面,中福公司作為中外合資企業,業務活動中形成檔案所采取的紀年方式也存在差異,確立中福公司檔案本體的時間概念模型時應采取統一紀年形式,確保時間描述準確;在空間方面,中福公司從注冊成立到終止經營歷經半個世紀。其間,存在歷史環境變化導致的地名變更,檔案中所記載的關于地理位置的內容或存在“一地多名”現象,為此需做到根據可考歷史事實,梳理地理位置名稱的演變情況,采用統一的空間位置描述語言,保證空間概念模型的準確性;在人物方面,中福公司檔案存在同一人物擁有多種不同稱謂的別名現象,如孫越崎與其原名毓麒,因此在構建人物概念模型時需建立人物實體別名間的關系,明確人物概念模型的稱謂指代,確保其唯一性;在組織方面,與人物概念模型類似,中福公司檔案中出現的社會組織,需要按照一定的敘詞表標準為其建立分類體系,建立每個社會組織不同名稱代指的唯一標引符,確保每一社會組織名稱代指在敘詞表中存在與之相對應的標引符;在事件方面,針對中福公司檔案實體所反映的真實事件詳情構建事件概念模型。

以概念模型形式對中福公司檔案資源進行分解,重組為細粒度的檔案知識元從而構建檔案知識本體,為后續中福公司檔案資源的數據關聯、發布與應用建立數據基礎。

4.3 數據關聯。借助語義網技術的檔案文化數據資源語義組織是構建知識本體之間語義關系的重要環節,同樣也是智慧數據資源建設區別于傳統檔案資源建設所在。

通過對中福公司檔案本體進行語義組織,建立檔案知識本體之間的邏輯關系,將數據與實物、數據與數據等關聯起來,構建中福公司檔案數據資源內關聯,以關聯數據的方式進行發布,從而形成一張巨大的檔案資源語義數據網絡。

在由河南省檔案館主導的中福公司檔案整理與開發項目開展過程中,制定了《中福公司檔案著錄細則》與元數據方案,并建立了高頻的人名、地名、貨物名等英文與中文翻譯對照表,參考ISO25964-2所制訂的敘詞表與其他詞表映射的標準可形成中福公司檔案主題詞表。根據中福公司檔案主題詞表所設定的描述規則,針對中福公司檔案知識本體概念模型中時間、空間、人物、組織和事件或者實物語義之間進行的標引,實現對中福公司檔案內容、形式和管理特征的規范化標引,建立起中福公司檔案在某一主題下檔案匯集內不同文件之間的關聯,形成關于這一主題的完整、詳細的內容網絡。

4.4 數據應用。專題檢索。中福公司檔案史料作為相關領域專家學者們長久以來關注的重點對象,中福公司檔案智慧數據資源建設成果將為其帶來學術研究的便利。利用經過語義組織與關聯發布的中福公司檔案智慧數據進行專題化檔案知識檢索服務,專注于用戶的實際需求,按照不同的專題遴選有較強利用價值或潛在利用價值的檔案智慧數據,最大程度滿足用戶專題檔案知識的需要,檔案利用者在進行檢索時僅需輸入所需檔案關鍵詞,即可得到該主題相關的查全率較高的檔案數據以及其知識化組織成果,大大降低了專家學者們的檢索成本,從而進一步促進中福公司檔案的利用。

知識推薦。檔案知識推薦服務作為檔案知識化服務的一大組成部分,可以依據用戶畫像主動地提供有針對性的推薦服務,在檔案服務過程中能夠起到優化服務提供方式和改進現有服務手段的雙重作用。用戶以一定目的性查閱中福公司檔案時,可為之推薦與其查閱目標相關的人物、地點或事件,引導和滿足用戶的知識需求,滿足檔案知識服務與用戶需求的雙向匹配,創新中福公司檔案智慧數據開發與服務方式。

智慧服務。綜合數字人文理念與知識圖譜的技術方法,建設基于GIS技術的中福公司檔案資源和文化共享知識庫,根據不同主題將事物的空間數據和屬性數據結合起來提供給用戶,將該技術應用于中福公司檔案文化數據的呈現,除提供必要的檢索功能外,還可根據不同主題將事物的空間數據和屬性數據結合,借助可視化技術展示,構建靈活的、開放的、延續的,集時間、空間、人物、組織、事件多項檔案數據展示于一體的中福公司檔案智慧數據資源的共享平臺,形成完整的數據地圖,將中福公司歷史真實圖景鋪展于用戶面前,嘗試構建中福公司歷史模擬環境,利用智能問答技術,增強人機交互體驗,為其提供中福公司檔案智慧化服務。

本文系河南省科技攻關項目“數字人文視域下中福公司檔案開發利用研究”(202102310307)階段性成果。

參考文獻:

[1]李宗富,崔白璐.國內中福公司檔案研究回顧與展望[J].檔案管理,2020(03):92-95.

[2]衡芳珍.英商福公司研究述評[J].河南理工大學學報(社會科學版),2010,11(02):242-249.

[3]錢毅.基于三態視角重新審視檔案信息化建設[J].浙江檔案,2019(11):18-21.

[4]李寶玲,朱蘭蘭.重構歷史真實圖景:河南省檔案館館藏中福公司檔案整理開發研究之一[J].檔案管理,2021(03):7-10+14.

[5]夏天,錢毅.面向知識服務的檔案數據語義化重組[J].檔案學研究,2021(02):36-44.

(作者單位:鄭州航空工業管理學院 來稿日期:2021-10-19)

主站蜘蛛池模板: 亚洲黄色成人| AV无码无在线观看免费| 久久99热这里只有精品免费看| 欧美无遮挡国产欧美另类| 欧美笫一页| 国产高清在线丝袜精品一区 | 人妻精品久久久无码区色视| 亚洲人成在线免费观看| 国产麻豆aⅴ精品无码| 亚洲精品无码抽插日韩| 久久久亚洲国产美女国产盗摄| 国产97视频在线观看| 一边摸一边做爽的视频17国产 | 女同国产精品一区二区| 999在线免费视频| 国产真实乱了在线播放| 2021天堂在线亚洲精品专区| 国产玖玖玖精品视频| 日本午夜视频在线观看| 免费在线一区| 在线播放国产99re| 色成人综合| 日韩高清成人| 国产精品成人AⅤ在线一二三四| 国产成人一级| 国产成熟女人性满足视频| 免费国产高清精品一区在线| 国产精品一区二区国产主播| 久青草网站| 欧美激情视频二区| 高清不卡毛片| 亚洲无码久久久久| 天天婬欲婬香婬色婬视频播放| 亚洲Va中文字幕久久一区 | 日韩中文字幕免费在线观看| 亚洲国产看片基地久久1024| 欧美不卡二区| 99久久精品国产综合婷婷| 无码 在线 在线| 亚洲国产中文综合专区在| 久草中文网| 亚洲人成亚洲精品| 久久久91人妻无码精品蜜桃HD| 欧美高清日韩| 国产91精品久久| 亚洲精品视频网| 十八禁美女裸体网站| 丁香五月亚洲综合在线| 四虎影视永久在线精品| 国产成人久视频免费| 99免费在线观看视频| 美女国产在线| 国产成人一级| 国产精品开放后亚洲| 国产成人无码久久久久毛片| 99久久精品免费观看国产| 欧美亚洲一二三区| 九月婷婷亚洲综合在线| 好久久免费视频高清| 蜜臀AV在线播放| 日韩亚洲综合在线| 日本高清视频在线www色| 青青青草国产| 澳门av无码| 亚洲AV电影不卡在线观看| 国产精品无码AⅤ在线观看播放| 日韩欧美在线观看| 美女一级毛片无遮挡内谢| 色精品视频| 99青青青精品视频在线| 无套av在线| 91久久国产综合精品女同我| 日韩av高清无码一区二区三区| 成人av专区精品无码国产 | 日韩在线中文| 天堂岛国av无码免费无禁网站 | 欧美综合区自拍亚洲综合天堂| 日韩123欧美字幕| 欧美不卡视频一区发布| 9啪在线视频| 精品国产免费观看| 国产精品漂亮美女在线观看|