999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

Xunzi the LLM—A Way for People to Access Ancient Chinese Texts大型語言模型“荀子” 讓人們接觸中國古籍

2024-11-06 00:00:00
時代英語·高一 2024年7期
關鍵詞:文本用戶語言

Thousands of years ago, texts appeared on animal bones, bronzes, bamboo slips, and silk brocades before they were written on paper. But now these ancient Chinese texts have a new container.

In December 2023, a research team from Nanjing Agricultural University has rolled out Xunzi, a large language model (LLM) and XunziChat in association with Gulian, a professional ancient Chinese text publisher.

Wang Dongbo, the leader of the research team, said that the large language model was named after Xunzi because Xunzi was not only a prominent Confucian philosopher during the late Warring States Period (475 BC—221 BC), but also a pioneer in presenting and explaining theories of linguistics in ancient China.

When asked why he and his partners made the large language model, Wang explained that traditional Chinese characters, vertical layout, and the absence of pausing and punctuation are all obstacles that readers have to overcome when they read traditional texts.

To create Xunzi the LLM, Wang and his partners first did a lot of research. Since 2013, his team has worked tirelessly to digitize Chinese classics like the Siku Quanshu, or the Complete Library in Four Sections. “The hard work involves a large-scale corpus of two billion Chinese characters, which has laid a solid foundation for the large language model,” said Wang.

幾千年前,文字先是寫在獸骨、青銅器、竹簡和織錦上,然后才被人們寫在紙上。但如今,這些古老的中文文本已經有了新載體。

2023年12月,南京農業大學的一個研究團隊,與一家專業的古籍出版公司古聯聯手,推出了大型語言模型荀子和荀子對話模型。

研究團隊帶頭人王東波表示,該大型語言模型以荀子的名字命名,是因為荀子不僅是戰國(公元前475年—公元前221年)晚期著名的儒學思想家,還是提出和解釋中國古代語言學理論的先驅者。

當被問及他和他的同伴創建這個大型語言模型的原因時,王東波解釋道:繁體字、豎版、缺少停頓和標點符號都是讀者在閱讀繁體文本時需要克服的障礙。

為了創建大型語言模型荀子,王東波和他的同伴們先做了大量的研究。自2013年以來,他的團隊始終致力于將《四庫全書》等中國經典書籍數字化。“經過辛勤努力,我們建立了20億個漢字的大型語料庫,為建立大型語言模型奠定了堅實的基礎。”王東波說。

But their efforts seem to have paid off. Now Xunzi the LLM can tag, translate, punctuate, and understand scraps of ancient Chinese texts. It can even do part-of-speech analysis and retrieve specific information, such as names, events, and places from a text.

With this LLM, ancient Chinese texts can be accessed by more Chinese people, including students. For instance, if users type shangu into the chat box, they will not only discover what it is translated to but also see that it can refer to a person’s courtesy name in certain ancient Chinese texts. Through Xunzi’s retrieval function, users can get more specific cultural information based on courtesy names.

“The model can help us mine for more information hidden in our cultural legacy and find unnoticed models and connections,” said Wang.

But Wang and his team aren’t simply focused on target users in China. They are aiming at the rest of the world as well. They have shared the LLM on GitHub and other websites, allowing users to download and use it for free. “Our team is committed to the philosophy of making our data and model globally accessible. We hope this will encourage more people to appreciate excellent traditional Chinese culture,” Wang explained.

他們的努力似乎得到了回報。現在,大型語言模型荀子可以對中國古代文本的片段進行標記、翻譯、加標點和閱讀理解。它甚至可以進行詞性分析并檢索特定信息,如文本中的名稱、事件和地點。

通過這個大型語言模型,包括學生在內的更多中國人,可以接觸到中國古籍。例如,如果用戶在聊天框中輸入shangu的拼音,它不僅能識別出山谷一詞,還會給用戶指出與這個詞相關的、古籍中一個中國文人的字等。通過荀子的檢索功能,用戶可以根據古人的字獲取更具體的文化信息。

“這個模型可以幫助我們挖掘更多隱藏在文化遺產中的信息,找到未被注意到的樣本和關聯。”王東波說。

然而,王東波和他的團隊不僅著眼于中國的目標用戶,還將目光投向了世界其他地區。他們在GitHub和其他網站上共享了荀子,允許用戶免費下載和使用。“我們團隊秉持著讓我們的數據和模型能在全球范圍內被人們使用的理念,希望以此鼓勵更多人了解中國優秀傳統文化。”王東波解釋道。

Word Bank

theory /'θ??ri/ n. 理論;原理

pause /p??z/ v. 暫停;停頓

The woman spoke almost without pausing for breath.

obstacle /'?bst?kl/ n. 障礙;阻礙

analysis /?'n?l?s?s/ n. (對事物的)分析

appreciate /?'pri??ie?t/ v. 欣賞;賞識

You can’t really appreciate foreign literature in translation.

猜你喜歡
文本用戶語言
語言是刀
文苑(2020年4期)2020-05-30 12:35:30
在808DA上文本顯示的改善
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
讓語言描寫搖曳多姿
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
累積動態分析下的同聲傳譯語言壓縮
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
我有我語言
主站蜘蛛池模板: 亚洲视屏在线观看| 久久国产精品麻豆系列| 国产一区在线视频观看| 亚洲一区免费看| 欧美在线精品一区二区三区| 国产日韩精品一区在线不卡| 国产9191精品免费观看| 中文字幕欧美日韩| 亚洲成网777777国产精品| 精品黑人一区二区三区| 午夜啪啪福利| 成人综合网址| 少妇极品熟妇人妻专区视频| 亚洲国产午夜精华无码福利| 三上悠亚在线精品二区| 99在线观看精品视频| 国产爽爽视频| 国产精品yjizz视频网一二区| 久久久亚洲色| 婷婷激情五月网| 欧美日韩成人在线观看| 免费观看成人久久网免费观看| 亚洲一区二区三区国产精华液| 伊人久久久久久久| 97视频在线观看免费视频| 97精品久久久大香线焦| 97成人在线观看| 97狠狠操| 亚洲午夜国产片在线观看| 欧美国产在线一区| 国产一区二区三区在线无码| 超清人妻系列无码专区| 国国产a国产片免费麻豆| 国产三级精品三级在线观看| 欧洲亚洲欧美国产日本高清| 高清视频一区| 1级黄色毛片| 国产精品久线在线观看| 五月六月伊人狠狠丁香网| 一级毛片基地| 欧美笫一页| 精品夜恋影院亚洲欧洲| 97国产在线视频| 久久久国产精品免费视频| 人妻无码一区二区视频| 四虎国产精品永久在线网址| 国内精品久久久久鸭| 青青青国产视频手机| 久久毛片免费基地| 欧美色综合久久| 囯产av无码片毛片一级| 午夜人性色福利无码视频在线观看| 国产成人综合亚洲欧美在| 91综合色区亚洲熟妇p| 亚洲免费三区| 99偷拍视频精品一区二区| 在线视频亚洲色图| 最新国产在线| 国产性生大片免费观看性欧美| 久久狠狠色噜噜狠狠狠狠97视色| 亚洲码在线中文在线观看| 日本高清免费不卡视频| 国产chinese男男gay视频网| 国产jizz| 一级毛片免费观看久| 天天躁狠狠躁| 国产在线一二三区| 国产流白浆视频| 69精品在线观看| 无码内射在线| 国产电话自拍伊人| 欧美精品在线视频观看| 91破解版在线亚洲| 欧美国产日韩一区二区三区精品影视| 毛片久久久| 无码丝袜人妻| 中文无码伦av中文字幕| 国产自在自线午夜精品视频| 久草视频中文| 国产亚洲精品无码专| 久久永久免费人妻精品| 亚洲成人动漫在线观看|