一只小手



在大英博物館的柔光中,人們只能勉強看到鐫刻在這些古老泥板上的密密麻麻的楔形標記。這些細小的標記,是世界上最古老的書寫系統——楔形文字的遺跡。
大約150年前,學者們首次破譯了楔形文字,然而直到目前,能被讀懂的文字僅有一小部分,仍有約90%的文字未被破譯出來。但是,這種情況可能會有所改變,一項新技術正在給它們進行“解鎖”,效果還挺不錯。這都要歸功于現代工具——機器翻譯。
現在你是不是越來越好奇了,連學者們都無法完全破解這種古老文字的秘密,機器又是如何做到的呢?
見證古帝國的興衰
楔形文字起源于5000多年前的美索不達米亞,位于底格里斯河和幼發拉底河之間,也就是現在的伊拉克。它記錄了一個長達3000年之久的、復雜而迷人的文明。從王室之間憤怒內斗的信件,到安撫一個任性嬰兒的儀式,這些泥板可以讓人們從一個獨特的視角了解那段歷史,它們記錄了阿卡德、亞述和巴比倫帝國的興衰。據估計,人們已經挖掘出了約50萬塊楔形文字板,但還有很多仍深埋地下。
約150年前,學者們首次破譯了楔形文字,然而直到目前,仍有約90%的楔形文字未被翻譯出來。
但是,這種情況可能會有所改變.這都要歸功于現代工具——機器翻譯。
加拿大多倫多大學亞述學研究員佩龍現在正在進行的一個項目,是用機器翻譯公元前21世紀以來美索不達米亞文明的行政記錄,數量多達69000份。
美索不達米亞文明孕育了車輪、天文學、每小時有60分鐘的計時制、地圖、洪水和方舟的故事,以及世界上最古老的英雄敘事詩——《吉爾伽美什史詩>。這本詩集主要是用蘇美爾語和阿卡德語寫成的,能讀懂這些語言的學者少之又少。
除了泥板,還有5萬多枚美索不達米亞雕刻印章散落在世界各地。幾千年來,古人使用由雕刻石頭制成的印章,這些印章被壓入潮濕的黏土中,用來標記門、罐子、石板和其他物品。這些刻章只有1/10被編入目錄,更不用說翻譯了。
英國牛津大學亞述學教授達爾表示,“我們所獲得的關于美索不達米亞文明的資料比古希臘、古羅馬和古埃及的加起來還要多,但真正的挑戰在于找到能讀懂它們的人。”
佩龍與其團隊正在對一個數據庫中的4000個古代行政文本樣本編寫算法。這些行政文本包括交易和運輸記錄,比如把羊、蘆葦束或啤酒運到神廟或個人手中的記錄。這些文字最初是用蘆葦筆刻在黏±上的,向我們展示了古代美索不達米亞文明的日常生活情況,包括權力結構和貿易網絡,同時還展示了社會歷史的其他方面,如女工的角色。
這些行政文書的措辭很簡單,例如“第15天,廚房有11只母山羊”。這種特點使得它們特別適合被自動化處理。一旦算法學會了如何將樣本文本翻譯成英語,它們就能自動翻譯其他泥板上的文字了。
佩龍希望機器分析也能弄清蘇美爾語的一些特征,這是至今仍困擾著現代學術界的難題。這種已經滅絕的語言與任何現代語言都沒有聯系,但卻保存在以楔形文字書寫的泥板中。這可能是我們與更古老,甚至沒有歷史記載的社會之間最后的聯系。
觸碰古老寶藏
多虧了先進的成像技術,現在任何人只要能上網就能接觸到這些寶藏。比如,世界上現存最古老的皇家圖書館,人們正在將它數字化。這座圖書館位于尼尼微,由亞述國王亞述巴尼帕建造。雖然早在公元前612年,尼尼微遭遇洗劫時,這些泥板被火烤得又黑又硬,但上面的文字仍可辨認。
新的成像技術讓人們在處理這些古老且破損嚴重的文本時更加輕松。有了精細的圖像,人們就有可能找出那些肉眼看不見的模糊標記。
一個名為“楔形文字數字圖書館倡議”的項目,將保存在德黑蘭、巴黎和牛津館藏中的泥板及印章進行數字化處理。這個龐大的在線數據庫已經包含了世界上約1/3的楔形文字,以及一些未被破譯的書面語言(如古伊朗的原始埃蘭語)。
如果沒有這樣龐大的數字資源,讓機器進行翻譯幾乎是不可能的。
數字化還幫助研究者們將散落在世界各地的文本拼湊起來。
研究人員曾對美索不達米亞的200多枚石印的3D圖像進行了數字化處理。在試點項目中,他們使用了人工智能算法校驗了6塊碑文,并識別出在世界其他地方發現的與之匹配的石印。算法準確地挑選出了兩塊現存于意大利和美國的泥板,這兩塊泥板上蓋的石印是一樣的。
在過去,想要將石印和印痕匹配起來困難重重,因為許多石印保存在數千千米之外的地方。而現在,人工智能的發展能幫助人們探索世界各地收藏品中蘊藏的豐富信息。
破譯古人的語言
成像技術也改變了對于未破譯文本的研究。
對于數量少、具創造性文本的破譯,人類往往比機器做得更好,人類有著對生活和組織方式的深入理解,以及高度的靈活性。例如,早期的楔形文字符號并不是線性排布的,而是簡單地與畫在周圍的方框排在一起。原始埃蘭語是三維立體的,一個圓印的深淺不同意義也不同。但是,技術可以放大、分享和比較圖片的細節,加快了破譯進程。
佩龍希望機器最終能夠翻譯更復雜的蘇美爾語和其他語言,比如阿卡德語。也許有一天,我們將能夠閱讀所有古老文字的翻譯版本。
古代美索不達米亞的國王們深深地思考著過去和未來。他們崇敬前朝的楔形文字,也將記錄著他們名字和成就的銘文埋藏地下,希望后世的統治者會將榮耀歸于自己。
在某種程度上,他們的愿望已經實現了。他們經歷過的戰爭和征服可能已經被大多數人遺忘,但是他們最強大的發明——文字,在過去的幾干年里助力了人類思想和技術的發展。
而現在,人類開始訓練機器從過去中學習。(原文刊載于BBC網站,標題為《The key to cracking long-deadlanguages?》)(責任編輯:白玉磊責任校對:司明婧)