999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

數字化是全漢字整理研究的必由之路
——《字書字料庫的理論、實踐與應用》試評

2021-11-29 14:27:51單志鵬
關鍵詞:理論研究

單志鵬

(北京語言大學 語言科學院,北京 100083)

柳建鈺教授的《字書字料庫的理論、實踐與應用》一書由中華書局于2021 年5 月正式出版,該書是國內外第一部系統研究字料庫的學術專著,它將字料庫的理論探索、實體建設與應用研究三者有機結合起來,充分驗證了字料庫的實用價值和字料庫漢字學的學科意義。不論是在理論上,還是在實踐以及應用上,該書都充分說明了字料庫建設與研究在大數據時代具有必要性和可行性?!蹲謺至蠋斓睦碚?、實踐與應用》一書在字料庫建設與字料庫漢字學研究中的首創價值是值得肯定的。

一、研究背景

隨著認知水平的提高與知識儲備的增加,跨學科的研究視角逐漸受到學界的普遍關注與重視。以往單一的研究視角、研究方法和研究理論對研究對象做到了日益“專、精”,但隨著研究的逐漸深入,單純的“專、精”很容易讓研究走入瓶頸,同時也限制了研究思路,很難發掘出研究的極大值。而跨學科、多模式的交叉研究將拓寬研究思路,只有有效借鑒其他學科的研究方法與理論,多學科互動,才能促進對研究對象更深、更廣的認知。孫磊認為,“現代科學技術突飛猛進的發展為新興學科或交叉學科的產生提供直接動力;學術環境的日益改善為新興學科的產生提供必要條件;生動的社會實踐則推動著新認識的產生,催生新的學科門類的出現。”[1]基于這樣一系列的原因,建立以目標導向為中心的關聯性趨近的相互貫通的交叉研究領域成為當前學術研究的主要趨勢。

“人文科學理論創新的一個重要機制在于轉換視域,在語言學研究中開展交叉學科研究就是一種視域的轉換?!盵2]當前漢字學研究視域的轉變就是要改變以往從“故紙堆”中人工翻閱文獻、依靠學者自省或依靠個別數據來總結歸納漢字學規律的范式,轉而借助信息科學及其他相關學科的理論與技術,將漢字現象、特點、理論同信息科學及其他相關學科深度結合,進行數理轉化,數據分析,量化對比,走大數據、信息化、科學化的道路。王寧先生指出:“漢字學和信息科學技術結合的可能性,給兩個學科都帶來了新的增長點;而漢字學和信息科學技術結合的難度,對兩個學科又都是一種挑戰……在21 世紀,漢字學與信息科學技術的進一步結合,是可以預見的?!盵3]為了滿足全漢字數字化整理的迫切需求,經過長時間地探索,李國英、周曉文先生于2009 年率先闡發了字料庫建設的必要性和可行性,分析了字料庫的理論意義與現實價值,為當前字料庫的研究與建設奠定了理論基礎?!蹲謺至蠋斓睦碚?、實踐與應用》則是柳建鈺教授沿著李國英、周曉文先生所指明的主攻方向繼續深入探索和積極實踐后所取得的一份重要的字料庫研究成果。

二、內容簡介

《字書字料庫的理論、實踐與應用》全書共計十四章,可以分為三大部分,分別是理論篇(包括緒論、字料庫與字書字料庫概說、字料庫理論的提出及其價值、字料庫漢字學概說)、實踐篇(包括當前字料庫與“類字料庫”建設概況、字書字料庫系統建設的主要原則與基本流程、字書字料庫數據庫及軟件的設計、字書字料屬性庫的建設、字書字料的標注、字書字料的字際關系系聯、字書字料庫的日常維護管理)以及應用篇(包括字書字料庫與字書疑難字考辨、基于字書字料庫的字書漢字層積流變狀況調查研究、基于字書字料庫的通用規范漢字構形屬性調查研究)。

(一)理論篇

“名正則言順”,理論篇開篇明義,首先科學界定了“字料”“字料庫”“字書”“字書字料庫”四個核心概念。字料庫是由語料庫類推出來的概念,二者建設的基本思想一致,但對象、目的、原則等方面存在較大差異。字料庫是以“字”為核心,以漢字學理論為主要指導,對歷史上真實出現過的漢字字料的本體屬性與字際關系屬性進行全方面、綜合性、立體式的標注、整理和研究的大型漢字字料信息庫。從字料的存在形式、實現方式、書體風格、載體、時代、通行范圍、應用層面、使用民族或國別、性質、加工程度等角度可以劃分出不同類型的字料庫。不同類型的字料庫存在研究重點上的差異,可以稱為子庫,將業已建立起來的成熟的子庫進行整合就可以形成一個大規模漢字字料庫。

字書字料庫“是與語篇字料庫相對應的字料庫兩大類型之一,它專門收集和加工歷代字書中的真實漢字字料,是在大規模歷代字書文本基礎上生成的真實的漢字刻寫形態的有序集合,是利用計算機對字書漢字形體進行各種分類、統計、檢索、綜合和比較等研究的基礎,它能為漢字學及其他相關學科研究提供高度結構化的字書漢字數據信息。”[4]36歷代字書貯存的是經過專家學者系統整理過的社會用字,后世字書又往往求大、求全,重收集,輕整理,這就使得歷時漢字在共時層面上不斷地累積,可以說,字書文獻中蘊含著豐富的漢字字料信息。作者認為,歷代學者整理形成的大量字書文獻、當代計算機的技術支持以及漢字學與語料庫理論提供的指導,使得字書字料庫的建立具有操作上的可行性。

字書字料庫考察的是貯存狀態下的字料,可以利用計算機數據庫手段對漢字構形、字體演變、字際關系等漢字屬性資源進一步開發,從而實現字書漢字屬性價值的無限增值。所以,作者認為,“字書字料庫的建設,是漢字整理研究信息化、大數據化的必然選擇。通過以字書字料庫中的大規模字料數據為中心和出發點,憑借科學的統計方法,對字料數據進行充分地觀察、分析、描寫和概括,從中歸納抽繹出科學的漢字學理論,這將推動當前的漢字研究工作發生根本性變化。”[4]49基于此理念建立的字書字料庫具有強大的生命力,在漢字學研究過程中將發揮無可替代的作用。

該書還闡述了字料庫理論提出的價值與背景。作者認為,交叉學科研究方法的推廣應用、當前漢字整理的客觀現實、語料庫理論及語料庫語言學的影響以及李國英、周曉文先生關于字料庫理論的不懈探索都直接推動了字料庫理論與實踐的深入發展。

最后,該書論證了“字料庫漢字學”的學科定位、性質、內容與方法等相關問題。作者明確指出,“字料庫漢字學是以真實文本中出現的漢字字料為界定和描述漢字現象的起點,通過字料的采集、存儲、標注、檢索和統計分析,用來提出全新的漢字學理論或驗證、修正已有漢字學理論,并對字料庫如何應用于漢字教學與中文信息處理及其他相關學科進行研究的一門交叉學科?!盵4]68字料庫漢字學是人文社會科學與自然科學交叉接觸的產物。相較于“數據庫漢字學”或“數據庫文字學”等名稱,“字料庫漢字學”更加名實相符。字料庫漢字學將研究對象集中于本體理論研究、漢字整理與規范研究以及應用研究三個方面,是漢字學框架內的一門嶄新的分支學科。

(二)實踐篇

理論來源于實踐,反作用于實踐。實踐篇主要是在字料庫漢字學、語料庫語言學理論的指導下進行字書字料庫的實體建設研究。

該書對受漢字學與信息科學交叉需要而催生出的一些字料庫及“類字料庫”進行了介紹。如中國大陸的北京師范大學字料庫(BNUZLK)、華東師范大學古今文字及歷代字書資源庫、魏晉南北朝碑刻用字數據庫、漢字全息資源應用系統,等等;港臺地區的臺灣“中央研究院”“小學堂文字學數據庫”、香港中文大學人文電算研究中心“漢語多功能字庫”,等等;國外的日本東京大學“石刻拓本資料庫”、字形維基(GlyphWiki),等等。通過借鑒上述字料庫與“類字料庫”建設的先進經驗,取長補短,作者提出了建設字書字料庫系統應當堅持科學性、真實性、代表性、規?;?、前瞻性、先進性和共享性七個主要原則,建設階段主要有規劃、需求分析、設計、實現、字料采集、字料標注與使用及維護等七個方面。同時,認為C/S 架構的高安全性更適用于字書字料庫的開發建設。

該書又具體介紹了字書字料庫的建設情況。字書字料庫數據庫是關系型數據庫[4]139。所以,在建設過程中注意各類關系屬性的關聯性。作者首先介紹了數據庫與數據類型,依據類型將各類數表分為字頭基本信息類、字頭構形屬性類、字頭字際關系類、數據庫操作類及其他類等五大類,并介紹其中二十二個主要數據表的基本情況以及工具插件、界面設計、查詢功能和輔助功能為主的軟件系統設計的基本情況。從軟件設計的具體過程可以看出,字書字料庫軟件設計將漢字構形學、漢字字體學、語料庫語言學等理論知識融會貫通,由此也充分說明字書字料庫的建設是在科學理論指導下完成的,從而有力保障了字書字料庫本身的科學性。

從2014 年建成“CCFD 字書字料庫”系統V1.0版本開始,經過7 年的不斷擴充、升級、調整和完善,目前該系統共收錄字書、韻書、字形編等共計70 多部,在庫已標注字頭達到1 695 272 個,字頭參證文獻295 230 個,辭條總數達152 334 個。字料字體涵蓋篆、隸、行、草、楷五種,既收錄了甲骨文、金文、小篆等古文字字形,又收錄了隸書、楷書、行書、草書等今文字字形。不僅收錄官方權威正字字樣,還收錄社會通用層次字料和民間俗用層次字料。同時,全面吸納學界關于疑難字考釋成果,斧正以往大型字書的訛誤。就規模而言,“CCFD字書字料庫”系統已經躋身于成熟性高、數據量大的中大型字料庫之列了。該字料庫的基本信息(包括部首、筆畫數等)、構形信息(包括構形模式、組合類型等)以及字際關系(包括異體、同形、繁簡、本借等)三大界面基本標注信息完備。查詢窗口分為字樣信息查詢、公用信息查詢、基本信息查詢、構形關系查詢、字際關系查詢,可以滿足漢字學理論研究與應用研究的基本查詢需求。就科研使用而言,“CCFD 字書字料庫”系統也已經是一個實用性強、穩定性好的熟字料字料庫。

(三)應用篇

“治其器必求其用?!痹摃膽闷饕故玖俗謺至蠋煸趹蒙系膬炘叫院椭匾?。字書字料庫的現實應用主要體現在三個方面。

首先,字書字料庫在疑難字考辨上能夠發揮重要的作用。作者利用字書字料庫分別對“、、、”“、、、”“、、瑱”“、、、”“、通”“、、穼、罙、、”等七組疑難字進行了考釋溝通。學者可以從字書字料庫中快速提取疑難字,提高考辨工作的完成速度,提升考釋結論的科學水平,既可以復核時賢考辨結論,又可以修正學者考釋不準確之處。

其次,字書字料庫可以對字書漢字層積流變的研究提供助力。作者測查《說文》《原本玉篇》《類篇》等十五部字書中“糸部”收字的層積情況,剝離出共收、單見、歧出三種類型并進行系統描寫。在進行充分的調查分析后,作者認為,“字書中數量眾多的異寫、異構字形是我國古代字書收字流變狀況的真實反映。這些字形在字書中不斷層積,最終形成了歷代字書收字動輒三五八萬的局面?!盵4]336

最后,字書字料庫還有助于對漢字構形屬性進行全面測查。《通用規范漢字表》是目前漢字規范整理的最新權威成果,作者借助字書字料庫對《通用規范漢字表》的構件組合動態特點、結構層級數、各級構件及其功能、構形模式和布局圖式五個方面進行了更全面、更準確地構形屬性測查研究,彌補了這一領域的若干空白。

三、意義與價值

《字書字料庫的理論、實踐與應用》是國內外第一部專門研究字料庫的著作,首次對字料庫進行了理論、實踐與應用三方面的有益嘗試,也是第一部開啟字料庫漢字學研究范式的重要專著。該書的意義與價值主要體現在以下三個方面。

首先,作者嘗試建立“字料庫漢字學”這一交叉學科。從1990 年王寧先生首次使用“字料”用語,到2009 年李國英、周曉文先生科學定義“字料庫”概念,再到2014 年BNUZLK 字料庫系統的建構與應用以及海內外各類字料庫與“類字料庫”的建立,字料庫的發展歷程充分證明了它在漢字學研究過程中的獨特價值和巨大潛力。不論是在漢字多方面屬性的量化研究中,還是在漢字共時形體關系整理與歷史形體演變研究中,字料庫能夠發揮的作用都是非常明顯的。在字書字料庫建設中,作者指導碩士研究生對字書新收字整理、疑難字考釋、字體對比描寫、字頭對比分析等方面的研究,都充分印證了字料庫不單純只是一個研究工具或檢索工具,而是一個能在漢字學研究過程中發揮重要作用的具有理論創新價值的新事物,并從實踐上驗證了字料庫的建設與研究符合當前漢字學研究需求,字料庫漢字學的研究也是可以納入漢字學整體框架體系中的。字料庫漢字學有著自己的學科性質、研究內容、理論思維,理應成為漢字學框架內的一門新的分支學科。

其次,該書為當前及未來一段時期內字料庫的建設提供了可資借鑒的科學操作范式。字書字料庫是貯存字書漢字字料的資源庫,需要解決好各類界面的顯示、圖片的儲存與提取、各類屬性標注以及代碼轉換等一系列相關問題。該書在實踐篇中詳細論述了軟件設計的原則與流程、各類屬性庫的建構、字料屬性系統的標注、字際關系的系聯以及日常維護管理等相關問題,科學規劃了字料庫建設過程中遇到的大部分問題,為日后學界建設字料庫軟件提供了科學范式。

最后,該書將推動字料庫、漢字學與字料庫漢字學之間的和諧健康發展。第一,字書字料庫將為漢字學研究提供一手數據來源。“從統計數據的來源來看,一般有兩種渠道:一是來源于直接的調查和科學實驗,我們稱之為第一手或直接的統計數據;二是來源于別人調查或實驗的數據,我們稱之為第二手或間接的統計數據?!盵5]字料庫直接匯集真實文本中的字料,經過對字料的科學、系統、完善地標注,將各個參數關聯成一個有機整體,在進行數理統計、對比、分析之后,將會得到科學的一手數據。第二,字料庫在科研應用中將會量化數據,從而驗證漢字學理論知識,同時,在漢字學研究中發現的新現象、新觀點還會反哺字料庫與字料庫漢字學的建設與研究。所以,該書在理論探索與實踐操作上具有重要的意義與價值。

理論的發展需要實踐的檢驗,而實踐又會促進新理論的發生和發展,《字書字料庫的理論、實踐與應用》就是很好的明證。

不過,該書也存在兩點不足。首先,應用篇只對疑難字考釋、字書層積流變探究、構形屬性分析三個方面進行了展示,尚未體現出字書字料庫具有廣闊使用領域的特點。其實還有很多領域可以展示字書字料庫的優越性。例如我們可以借助字書字料庫進行字料通行范圍的層次研究。依據字書字料庫標注的字料身份信息,分出漢字字料的上層、中層、下層的層次歸屬,排列演變序列,從而可以描述不同層次漢字字料的相互影響。再如,我們可以借助字料庫進行漢字識字教學以及漢字文化闡釋等方面的研究。其次,該書對各種字料庫與“類字料庫”的分析還不夠全面,只是簡單介紹了基本信息、特點,沒有對比各類字料庫與“類字料庫”的異同之處,使讀者不能很清晰地了解其間的差異,這些問題希望以后該書修訂時能予以考慮。

四、結語

我們認為,柳建鈺教授的《字書字料庫的理論、實踐與應用》具有較高的理論價值。該書系統論述了字料庫的基本理論,探討了字料庫漢字學的學科性質、研究內容等相關問題,整體框架比較完整,理論闡發科學深入。字書字料庫數據平臺具體建設步驟的展示也為后續學界進一步研發類似字料庫提供范式,其現實意義是非常明顯的。字書字料庫全面標注漢字字料的基本信息,系統展示字料字際關系屬性,完整呈現字料的文化層次、社會使用以及字料的音義信息,是一個值得學界信賴的漢字字料數據資源平臺。研究顯示,在疑難字考釋、漢字構形屬性分析等應用研究上字料庫呈現出了高效、便捷的特點。這些在該書中都進行了翔實的論證。

從整體上來看,當前的語料庫研究成果系統、豐碩,研究人數與團隊不斷增加,語料庫語言學的研究深度也已經達到了很高的水平,反觀字料庫的建設與研究卻顯得勢單力薄,方興未艾。我們有理由相信,在該書理論及實踐的引導下,未來字料庫的建設與字料庫漢字學的研究會像語料庫那樣向著更深入、更系統、更完善的方向發展,會形成一批高水平的學術團隊,發表一系列高質量的研究成果,建立起多個像BCC語料庫那樣開放共享的字料庫平臺,為科學的全漢字整理與漢字學研究提供數據支持。

猜你喜歡
理論研究
FMS與YBT相關性的實證研究
堅持理論創新
當代陜西(2022年5期)2022-04-19 12:10:18
神秘的混沌理論
2020年國內翻譯研究述評
遼代千人邑研究述論
理論創新 引領百年
相關于撓理論的Baer模
視錯覺在平面設計中的應用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
EMA伺服控制系統研究
新版C-NCAP側面碰撞假人損傷研究
主站蜘蛛池模板: 国产新AV天堂| 欧美成在线视频| 美女毛片在线| 中文字幕va| 99视频在线免费| 全午夜免费一级毛片| 又猛又黄又爽无遮挡的视频网站| 亚洲色精品国产一区二区三区| 欧美日韩在线亚洲国产人| 在线视频亚洲欧美| 99资源在线| 在线观看亚洲天堂| 91麻豆精品国产高清在线| 在线欧美一区| 直接黄91麻豆网站| 9久久伊人精品综合| 欧美成人看片一区二区三区 | 欧美福利在线播放| 国产成人av一区二区三区| 伊人久久婷婷五月综合97色 | 波多野结衣一区二区三区四区视频| 色老头综合网| 久久无码高潮喷水| 青青草原国产| 亚洲午夜国产片在线观看| 一级毛片免费观看不卡视频| 午夜毛片免费观看视频 | 亚洲国产欧美国产综合久久 | 992Tv视频国产精品| 澳门av无码| 欧美日韩亚洲国产| 国产a v无码专区亚洲av| 99er这里只有精品| 91探花在线观看国产最新| 性欧美久久| 啪啪啪亚洲无码| 欧美成人精品一级在线观看| 99色亚洲国产精品11p| 高清码无在线看| 一区二区三区四区精品视频 | 欧美性久久久久| 成人国产免费| 91啪在线| 999精品色在线观看| 欧美日韩一区二区在线免费观看| 亚洲第一天堂无码专区| 欧美另类图片视频无弹跳第一页| 免费无遮挡AV| 欧美一级爱操视频| 日韩av手机在线| 日韩精品欧美国产在线| 亚洲天堂网在线观看视频| 亚洲精品国产乱码不卡| 亚洲激情区| 乱色熟女综合一区二区| 亚洲免费三区| 无码'专区第一页| 这里只有精品在线播放| 亚洲人成网址| 黄色成年视频| 一级片免费网站| 91视频99| 色综合网址| 国产人前露出系列视频| julia中文字幕久久亚洲| 国产精品手机在线观看你懂的| 亚洲欧洲免费视频| 亚洲国产无码有码| 亚洲中文字幕国产av| 中文无码日韩精品| 国产玖玖玖精品视频| 丰满人妻中出白浆| 国产精品男人的天堂| 国产精品嫩草影院av| 日本伊人色综合网| 99热6这里只有精品| 色噜噜久久| 中日无码在线观看| 欧美视频在线播放观看免费福利资源 | 国产产在线精品亚洲aavv| 亚洲综合精品第一页| 91久久国产成人免费观看|