999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

現代手寫文書檔案識別方法研究

2020-11-23 09:43:17解放軍31422部隊葛曉剛姜寶欣
辦公室業務 2020年16期

文/解放軍31422部隊 葛曉剛 姜寶欣

一、精心準備查考資料

手寫文書檔案識別雖說是一項較為基礎的工作,但是要想漂亮完成以獲得優秀成果,必須正規化對待,根據文獻類別的不同做好充分的準備工作。

(一)通用類查考資料的準備。1986年,在我國重新發表經少量修訂后的《簡化字總表》以前,繁體字和異體字大量存在于人們的行文當中。所以當我們進行現代早期檔案的識別工作時,需要一些通用類查考資料來輔助識別,從而以簡體字的形式流暢地將檔案中的信息展示出來。由上海辭書出版社出版,張書巖主編的《簡化字、繁體字、異體字對照字典》以及由崇文書局出版,楊合鳴主編的《漢字簡繁正異對照字典》,都可以作為文書檔案文字簡體化的主要工具書。在識別的具體工作中,我們利用此類工具書主要采用偏旁部首的檢索方式,檔案中清晰規整的字可直接找出對應簡化字,較為模糊的字可以通過偏旁部首查對與其寫法接近的字并依據上下文確定該字。另外,如果手寫文書檔案形成于白話文尚未成熟的時期,可能會在行文中存在大量的古語體式,那么《王力古漢語字典》也可幫助檔案工作者提高識別效率與準確性。

(二)專業類查考資料的準備。檔案工作者還需要根據手寫檔案的內容類別準備相應的專業類查考資料。例如識別專業檔案需要掌握相關的學術名詞才能達到最優的識別效果;識別戰地日記需要知曉大量的地名;識別個人工作日記需要了解其所在單位的大致狀況。故而在識別現代手寫文書檔案的過程中,檔案工作者常常需要地圖、大事記、單位組織歷史沿革、專業名詞釋義詞典、相關人物志等多個類目的查考資料。在手寫文書檔案中,明確其中的人名、地名、時間、組織名稱和專業名詞,對于未來檔案的多方面利用尤為重要,這些查考資料的使用將大大提升手寫文書檔案識別的準確率。

二、靈活掌握識別技巧

識別字體模糊的現代手寫文書檔案,僅僅做好初步查考資料的準備,按部就班地識別很難達到理想的效果。在具體的識別過程中,需要檔案工作者具備較強的文字敏感度,能自然辨識出合理通順的句子,同時也需要較好的記憶力,能快速識別出之前已確認的文字詞匯。另外,檔案工作者還需快速適應手寫文書檔案的語言模式,以符合時代特征與檔案生成者個人書寫個性的思維邏輯來提高對檔案原件文字的識別準確率。

(一)巧妙運用漢語語法。現代手寫文書檔案識別工作者在陷入識別困難時,不能只盯著一個字鉆研,要結合整句話甚至上下文去體會這個字應該是什么,從而減小識別難度。整體與局部相互依賴,結合整句話來識別一個字時,必須把以“主謂賓定狀補”為基本框架的漢語語法引入手寫文書檔案識別當中去,進一步鎖定未知字或詞的詞性范圍。但這種方法并不絕對,一般只在手寫文書檔案識別過程中起參考作用,由于部分手寫文書檔案生成者的書寫個性與隨意性,部分檔案并不完全遵循語法規則,故而字形依舊是識別手寫文書檔案的第一標準,檔案工作者需根據實際情況巧妙運用現代漢語語法結構。

(二)通假字與錯別字的區分。在系統化的簡體字尚未完全普及以前,漢字書寫方面有許多當時與當下都使用但是用法不同的文字。當工作人員看到一個有書寫錯誤嫌疑的文字出現時,先要確定該文獻成文時間距今是否久遠,若久遠應該明確那個時代的文字書寫體系發展到何種程度,若與今差別較大,不能直接將該字定性為錯別字。在具體識別中,我們應該看前后文是否有同樣的字在同樣的用法中出現,如果多次出現,則該字在當時很可能是這一語義下的官方通用字,應具體查閱確定后在識別稿中顯現原字,并做一注釋加以說明,這樣既可高度還原稿件,又不影響利用者對文獻的理解。這些“通假字”的普遍特點就是與當今相同語義的文字有著一樣或類似的讀音。例如“那末”—“那么”,“皇恐”—“惶恐”,“火伴”—“伙伴”,“逃亾”—“逃亡”,“底”—“的”等。

(三)采集文獻常用字的筆法。在識別書寫不夠工整的手寫文書檔案時,常常會遇到一些難以識別的常用字,這些字在一定的前后文語境下能夠通過語言邏輯辨別出來,當出現在文獻其他地方時,由于語境的變換,這些字很可能難以再次識別或識別錯誤。為了提高文獻識別的質量,檔案工作者在識別同一文獻過程中,應該對行文中出現頻率比較高的字進行采集匯總,制成簡易對照表以供互相傳閱,記憶常用字的筆法對整體文獻的識別有很好的串聯幫助作用。

三、合理運用分配方式

在識別不同年代、由不同人書寫的手寫文書檔案時,領導者需要對檔案工作者進行合理分工。這樣不僅會為檔案工作者減少壓力,同時也能降低文獻的識別難度,提高識別準確率。

(一)按文獻類型集中分配任務。檔案工作者的記憶是有限的,語言文字習慣的形成也需要時間,因此,工作組織者應該盡量將文獻歸類,將同一類型的文獻識別工作布置給同一個或同一批檔案工作者。這樣方便他們將有限的思維相對集中,更快地形成一種適合此類文書檔案識別的工作模式和思維方式,促使他們在較短的時間內進入工作狀態,逐漸提升在所識別領域的專業性,迅速提高工作效率和成果質量。組織者依據需要識別手寫文書檔案群體的不同情況,可以按照文獻生成年代、文獻書寫人、文獻內容領域以及文獻體裁等要素進行分類。

(二)多批次交換識別校對。現代手寫文書檔案識別成果要想印發甚至出版,成為供人利用的成品,絕不能只經過一次識別便草草了事。識別難度較低的手寫文書檔案至少需要對其進行兩次識別,難度較高的則需要進行三次以上的識別。在多次的識別過程中,由于個人難以克服的思維定式,組織者需要掌握文獻交換識別的原則。對手寫文書檔案進行第一次識別的檔案工作者要做到無差別的全文過濾識別,完畢后應交由他人進行二次識別。負責二次識別的檔案工作者可將識別重點側重于前者未識別出的文字和書寫相對模糊的文字。若需要對該手寫文書檔案進行三次識別,前一位工作者應將文獻中存在問題的地方標出,交由第三位識別人員。最后由專人對全部手寫文書檔案的識別內容進行匯總,檔案工作者在匯總時可脫離原文獻,側重于考究識別成果的合理性、流暢性以及標點符號的使用,并將問題反饋于前幾位識別人,這樣便形成了一個閉合流程,可以最大限度地保證識別成果的質量。

四、結語

檔案工作本身是一項平凡而枯燥的工作,細心認真是檔案工作者最重要的品質之一,而為手寫文書檔案識別設計一套精細合理的方法,是檔案工作者尊重檔案、正視歷史的體現。本文從查考資料的準備、每一位工作者的識別方法、識別群體的工作流程三方面提出了一些可行的建議,希望能夠為檔案工作者提供一些思路。

主站蜘蛛池模板: www.亚洲一区二区三区| 青青极品在线| 亚洲五月激情网| 美女潮喷出白浆在线观看视频| 亚洲美女一区二区三区| 亚洲成av人无码综合在线观看| 91亚洲精品第一| 亚洲av无码人妻| 亚洲精品日产精品乱码不卡| 久久久久青草线综合超碰| 国模视频一区二区| 欧美在线免费| 5388国产亚洲欧美在线观看| 国产精品亚洲一区二区三区在线观看| 久久国产精品嫖妓| 伊人色婷婷| 国产91成人| 成人午夜视频在线| 国内精品小视频在线| 国产超薄肉色丝袜网站| 一级一毛片a级毛片| 国产性生交xxxxx免费| 丰满人妻久久中文字幕| 99热这里只有精品2| 精品国产aⅴ一区二区三区| 91久久偷偷做嫩草影院| 伊人成人在线视频| 欧美另类精品一区二区三区| 91在线免费公开视频| 日韩精品一区二区三区大桥未久| 欧美精品v欧洲精品| 57pao国产成视频免费播放| 亚洲国产精品无码AV| 思思热精品在线8| 暴力调教一区二区三区| 中文字幕波多野不卡一区| 免费看美女自慰的网站| 国产在线观看一区二区三区| 国产乱视频网站| 亚洲国产成人超福利久久精品| 久久综合伊人77777| 日本免费精品| 日韩无码黄色| 婷五月综合| 国产靠逼视频| 国产福利免费视频| 激情乱人伦| 亚洲—日韩aV在线| 国产69精品久久| 高清不卡毛片| 国产激情无码一区二区免费 | 欧美三级自拍| 成人夜夜嗨| 免费可以看的无遮挡av无码 | 日韩福利在线观看| 久久久亚洲色| 亚洲精品色AV无码看| 国产精品99久久久久久董美香| 日本道综合一本久久久88| 亚洲午夜国产片在线观看| 免费一级无码在线网站| 国产精品区网红主播在线观看| 91视频青青草| 国产亚洲日韩av在线| 美女高潮全身流白浆福利区| 国产精品xxx| 永久毛片在线播| 国产精品99r8在线观看| a级毛片毛片免费观看久潮| 中文字幕乱码二三区免费| 伊人色婷婷| 国产精品无码翘臀在线看纯欲| 国产欧美日韩另类| 亚洲AV成人一区国产精品| 波多野结衣无码AV在线| 制服丝袜一区二区三区在线| 国产在线精品99一区不卡| 成年A级毛片| 国产精品女人呻吟在线观看| 中文国产成人久久精品小说| 伊人福利视频| 国产福利在线免费|