999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

計算語言學和自然語言處理:影響現代人生活的研究領域*
——訪談認知心理語言學專家左密夏博士

2015-11-27 11:24:29蘇俊銘宋靈青
中國電化教育 2015年5期
關鍵詞:語言研究

蘇俊銘,宋靈青

(1.臺南大學 數字學習科技系,臺灣 臺南 70101;2.中央電化教育館,北京 100031)

計算語言學和自然語言處理:影響現代人生活的研究領域*
——訪談認知心理語言學專家左密夏博士

蘇俊銘1,宋靈青2

(1.臺南大學 數字學習科技系,臺灣 臺南 70101;2.中央電化教育館,北京 100031)

自然語言處理;計算語言學;認知科學;信息檢索

訪談者:左密夏博士,首先非常感謝您接受此次專題訪談。您在計算語言學和認知科學研究領域工作了30多年,以這樣豐富的經驗,您一定有非常多的知識可以與大家分享。首先,您能否簡要地告訴我們什么是計算語言學(CL)嗎?再者,您能不能給我們一些相關的參考信息?

左密夏博士:這取決于您們的興趣焦點。從狹義上講,計算語言學可以簡單定義為 “使計算機能夠自動進行了解并產生語言所需要的操作流程”。我說“狹義” 是因為計算語言學和語言科技其實是可以應用到許多其他領域及實用任務。例如,它可以幫助人們進行溝通(聽、說、讀、寫、理解)、獲取信息,依此類推。

在所舉后者的情況下,整體過程是互動的,它對使用者的習慣和需求必須具備一定的感受性與理解度。而這也正明顯地指出計算語言學和認知科學是相關的。認知科學在這里結合了語言學家、計算機科學家和心理學家協同工作,以揭示解決特定問題時所需要的知識(此英文單字源自拉丁文的“認知”一詞)和所需的專有技術(流程)。例如,在語言生成的研究領域中涉及到語言問題:如何告訴問路人怎樣從地點A到達地點B。要解決這些問題,我們需要應用多重學科的態度及方法,這是極度重要的。然而,這并不是絕大多數人的實際做法,在一定程度上這是可以理解的,因為要做到多重學科互動首先需要具有一個相當開放的態度,并有和完全不同背景的“同事”做交流的意愿與態度。

再回到您最初的問題。計算語言學包含了信息溝通的四項主要技能所有必要的組成部分:口語、閱讀、聽力和寫作。這些不僅要擁有關于意、形、聲,即特定的語言知識(語法、詞匯、詞形),還需要包括其他類型的知識(世界知識、文化、社會習俗等)。這現象不限于母語,也適于其他外語,當然在翻譯過程中更加凸顯。它還涉及語言學習、信息獲取、信息檢索以及許多其他信息溝通的活動項目。如果您想對此有更深入了解,可以在維基百科以Computational Linguistics (計算語言學)或Language Technology (語言科技)來查找。

為了提供容易理解的相關數據,我在這次訪談文章后提供了一些重要的參考文獻,分類列表來呈現語言研究和認知語言學[1-18]、計算語言學[19-42]、心理語言學[43-48]、神經語言學[49][50]、學習分析[51-53]的相關文獻。此外,你們可以找到對應網站[54-58]連結,讓有興趣者能夠快速地對“誰是誰”以及當今主要的議題、技術、出版物和相關研究會議等信息有初步的入門了解。

訪談者:既然CL不再處于“童年”時期,您能不能給大家一些它發展過程的細節,例如理論上和方法上的演化和改變?

左密夏博士:有鑒于本次訪談的范圍,我對這個問題僅做簡短回答。對于那些有興趣進一步了解的讀者,我建議閱讀Jurafsky & Martin、Nugues和Altman的文章資料。這些內容都可以在網絡上免費獲取。回到您的問題。可想而知,在過去50年來,很多事情已經改變了。同樣地,想要有一個粗略的概念,您們可以開始看看維基百科,通過搜索 “Natural Language Processing”“Computational Linguistics”“Human Language Technology”或“Artificial Intelligence”,這些研究領域是和NLP緊密相連的,至少在一開始時是如此的。

計算機在60年多前并不存在,語言學在當時主要是理論性學說,研究往往是根據極少量且特制的例句開展的。需要注意的是,時下的計算語言學家做自然語言處理(包括機器翻譯)通常不依靠深厚的語言知識。整個處理是通過使用大量語言數據庫加上機器自動學習,也就是用統計數據方法進行的。

談起CL研究最初的驅動力是很有趣的。大約在50年前左右,結合了科學(語言學)、技術(計算機)和政治(“冷戰時期”由俄羅斯發射人造地球衛星開始的太空競賽等)因素,導致了在語言研究方面大規模的投資,或是我們今天所稱的語言科技研究。

在早期時代,我們做了菲爾莫爾(Fillmore, 過去30年來最權威的語言學家之一)所稱的“扶手椅語言學(Armchair Linguistics)”。現在的研究則是應用龐大的語料庫,依靠機器學習和統計方法和理論。這和過去使用的方法有著根本上的不同。在當時多數的語言研究人員以規則式方法(Rule-based Approach)來處理假構的例句(Made-up Example)。后來,隨著著人工智能(AI)時代的到來,研究者試圖建立全面性的系統(語法分析器、語言生成器、機器翻譯系統等)。所有這一切在20世紀80年代后期都因因特網(Internet)的出現和硬件的發展而發生了巨大變化。通過互聯網我們能快速取得儲存在網絡上的信息,現代計算機功能都非常強大且有巨大的儲存容量。此外,現今學者們習慣于為一個特定主題組成研究團體,互相快速地交換著數據、信息甚至程序編碼。因此,今天的研究趨勢不是建構或執行驗證理論,而是在建造資源、應用巨大的數據化語料庫,并評估其結果或方法的相對效率。此外,大量的語言處理是通過機器學習來完成。計算機不再只限于執行由程序人員直接下的指令,它能從巨量的數據中進行萃取(例如語料庫)。

訪談者:也許您可以介紹一些使用CL的應用,以及它對我們社會或一般民眾日常生活的影響。目前可見的有哪些影響?在不久的將來有哪些可能性?有哪些挑戰?

左密夏博士:這里提及的研究結果都已融入我們的現代生活中,很多的應用實例已自然地充斥在生活周遭,一般使用者渾然不覺這些應用成品是需要上游的“人工”的處理。所有這些應用在二三十年以前是難以想象的。其中有些是在“前臺”看得見的,因為它們經常是使用者付費的(例如您想安裝一個電子字典);其他成果應用則像是“內勤”工作,我們甚至沒有注意到它們(例如搜索引擎)。另有其他許多應用工具則每天為我們服務(不僅是研究學者、專員),例如機器翻譯、電子詞典、拼寫檢查、文本到語音轉換器等。

值得注意的是最好成果仍在我們面前,這會在不太遙遠的將來,可能再一個20年左右。這是因為學者們已經開始做知識資源和文字(數據語料庫)的數據探勘,它可以被看作是將人類集體的大腦中所具有的知識(一個全球性的社會知識)進行外化的事實。例如,在語言學習和語言教學領域,研究學者已經開始探勘語言學習者的學習數據。

關于“CL怎么影響我們社會以及一般大眾的日常生活 ?”這個問題,我的答案很簡單。它對我們社會的影響是多層面的:教育(例如在線學習、終身學習、遠程學習等)、文化、經濟、軍事等。很多工作直到最近都還是需要很大的人力投入,現在則可通過一臺機器來執行。雖然這聽起來可能有點可怕 (的確,如果管理不當的話),然而可以肯定的是,它也可以是非常有益的。想想一個普通公民的個人或專業需求,例如旅游信息、訂票,農民或醫生的各種需求。實際上現今已存在一些應用工具或服務,如聯合國糧食和農業組織(FAO)以表格形式或自然語言形式,提供農民進行決策和解決問題時所需要的信息數據。這同樣適用于許多其他領域。再如,一個住在偏遠地區的人需要醫療救助。我們可以假設讓此病人描述他的問題,以終端儀器進行現場測量讀取其生理數據后,由機器來進行分析并建議適當的療法。機器是參考已存有病者的基本數據及早先其家庭醫師所記載的疾病紀錄來進行分析。當然,這是不尋常的狀況,是需要謹慎進行的,但在原則上是可以做到的,至少可以適應一些特殊的情況。

除了上述的例子,我再舉一些與平常一般語言用戶的需求更密切相關的實例。電子詞典、數據語料庫的存取查閱、閱讀輔助工具、拼寫檢查器、雙向言語翻譯、信息和知識庫(數據庫、本體論、百科全書)獲取、輔助通訊(文字簡化、針對特定有認知缺陷的設計輔助工具)等,這些工具可以幫助那些找不到必要信息的語言學習者和用戶。值得注意的是,雖然有很多有用的信息已經存在于網絡上,它們往往還是相當靜態的,在引入自然語言處理后,在擷取和萃取信息上增添了不少靈活性。例如,如果以文字字符串的匹配來搜索,通常很多相關網站都可能不會被顯示的。但是,如果允許同義詞或詞形異變(“ring”和“rang”都是與撥打電話時有關聯的概念)的搜索,那很多潛在相關的網站內容就可能會被呈現出來。

至于CL在未來的發展可能性和面臨挑戰,答案取決于您所定的目標,您想要理解人類的頭腦和它是如何處理信息,或者您想要處理一個特定的語言(中文、法文等等)。CL處理方式是要完全自動式或交互式?您的目地是想建造一個資源(字典、知識庫、本體)或是一個應用工具(閱讀輔助、寫作輔助、機器翻譯)?顯然,針對每個不同的目標會有它特定的挑戰,針對每一個特定的語言也是同理的。

例如,一個外國人想學說中國話和寫中文,將不得不面對發音、音調和文字的問題。中文里有許多音在西方語言(英語、西班牙語、德語等)里根本不存在的。它的書寫系統更是完全不同的,因為西方語言以拼音為字的起點。值得注意的是,對即使是以中文為母語的人來說,書寫正確中文字有時也是個問題。一般中文為母語的孩童也需要一段相當長的學習時間以達到相當程度的書寫能力。

另舉一個非常不同類的語言為例:學習法文的挑戰之一在于它的發音(同音)和動詞變化。而像芬蘭語和俄羅斯語有眾所周知的變格(主格、賓格等等)的難處,德文也有變格的特色。除此之外,其動詞的位置也是一個挑戰。至于日文,動詞應該放在句子的尾端。我們可以不斷地談論每種語言的特殊性質,因為每一種語言都有其特定的問題。然而即使如此,各種不同的語言中也會有或多或少相似之處。

我們也不應忘記語言是表達思想的工具。然而,想法或概念僅是硬幣的一面,另一面就是詞形。另外很重要的一點是語言(包括文字)不僅是用來通訊溝通,它也是用來思考(或概念化)、腦力震蕩、信息檢索、推理等等。當我們在網絡上搜索信息時,我們也用文字(查詢問題),即使我們未必打算將這個搜索結果傳達給他人。因此,我們需要使用語言以為了能夠獲得所需要的信息。另外,對于那些我們想要取得的知識,為了能利于檢索,它不僅必須被儲存,而且還要被系統索引和有組織地儲存。還要注意的一點是語言往往不是絕對地精確:所有語言在它不同層面(詞意、發音、詞形)中常有許多含糊不清的現象。當我們說出單詞“Mouse”時,我們指的是那體型小的哺乳動物或計算機鼠標(Computer Mouse)?當讀到這個英文字“Read”時,您應該發音/rid/或/red/)?當聽到發音/red/時,它指的是“顏色(紅)”,或者“信息提取的活動(動詞‘閱讀’的過去式)”?正如您所見的,這領域仍存有大量的問題,其中許多仍尚在等待一個令人滿意的解決方案。

訪談者:您提到語言學習者或語言教育者兩者都可能受益于CL或語言科技方面所做的研究成果。能否請您在這個方面多談一點,并顯示兩者之間的關系?

左密夏博士:在過去,學生的語言學習過程都會有一位語言老師、一本字典、一本文法書和一些語本教科書的。這類的學習是通過指令的學習方法,其過程等和自然學習是完全不同的。在進入學校制度之前,每個孩子都由生活中的日常活動里漸進地學會母語和其他方言,他無時無刻不暴露(或沉浸)在豐富且具多種語言信息形式(如圖像、聲音等)的環境中,這種不知不覺地學習方式就像一切都是自然而然發生的。這種形式的學習環境我們可以通過現代技術來進行重建。我們可以通過看電影,聽我們喜歡的音樂等活動來學習外語。換句話說,我們可以一邊學習一邊獲得樂趣。但是,要讓這種學習方式真正地可行并有效率,信息必須被處理并相對有意義地呈現在各個動態環境中,這點大體來說已經有相當的發展。我們可以看到有字幕的原文電影,我們可以減慢語言錄音說話的速度或改變音調或口音、我們可以通過谷歌翻譯將一份文件翻成自己懂的語言等。在用計算機工作時,我們可以隨時從彈出的窗口查詢一個未知單詞的意思。

同樣地,我們能想象有一些系統工具專門協助寫作。當然,現今已有許多拼寫檢查器和電子字典,但我認為可以研發輔助寫作風格和文體的工具。它會自動檢測文章所提供的信息以及內容的邏輯順序(連貫性、凝聚力和代名詞的正確使用)等等。例如,在一個故事編寫中,您可能寫著 “很久很久以前,有一個名字叫亨利的國王。他有三個女兒,……”。正如您所看到的,語言里有很多方法來指代同一個人:他的名字(亨利),他的功能(國王),或以簡單的代詞(他、他的)來再次提到同一個人。然而,代詞的選用并不總是很容易地來決定要使用哪一個。例如在幼兒的語言學習中,他必須學習不能直接以“他”來啟動一段對話中的第一個句子,因為聽眾可能不知道“他”指的是誰。這是在成長經歷中社會化過程的一部分,您必須學會不僅從自己的角度,也從接收您的信息者的角度來看世界。語言生成的目的,不僅在于傳播說話者/寫作者想表達的內容,還必須把聽者/讀者的知識、興趣,甚至信仰等都列入語言生成過程中需要考慮的因素。

有鑒于這些和語言相關的復雜性,學習單詞和語法規則是絕對不夠的。語言基本技能的培養——閱讀、寫作和口語(流利度、發音正確度)是語言學習者極大的挑戰。然而,這也正好是語言科技可以做出很大貢獻的地方。今天已有多種學習輔助工具可以提供學習者許多學習的幫助。它們可幫學生們減輕認知負擔和心理壓力。它們專門負責處理學習中制式性方面(拼字、發音)的問題,由此可舒緩學習者的一部分壓力,讓他們的精神能夠專注于更高層次的溝通(含義、因果關系的解釋)。至于在導師或教師方面,語言科技工具可減輕他們的工作負擔,就像各式各樣的家用設備能幫我們省下許多打掃房子(吸塵器)、洗碗(洗碗機)或準備咖啡(咖啡機)等的時間和精力。此外,利用現代科技來學習可以讓我們的學習過程變得很自然、像無意中所產生的效果。例如,我們可以想象在玩游戲的同時,在您所選擇的語言中學到一些歷史或地理的知識。在這種情況下,學習語言結合在其他的活動中,就像是意外得來具有正面效益的“副作用”效果。

訪談者:那有關于遠距學習和計算機輔助語言學習(Computer-Assisted Language Learning, CALL)呢?它們用到CL/NLP的研究帶來好處了嗎?

左密夏博士:兩者都已達到AAA級的優點:任何人(Anyone)、隨時(Anytime)、隨地(Anywhere)。也就是說,學習完全可由學習者時刻隨其心情自定義。這是跟傳統學習方式比較時一個很大并且不應該被低估的優點。不幸的是,遠程學習和計算機輔助語言學習系統的開發常有過多的時間壓力,主要是因為往往以短期的經濟效益為考慮因素(時間投資效益)。這就是為什么它們很難深入探討到CL/NLP的問題,尤其是以心理語言學家的觀點來看這兩者的發展。然而,CL/NLP的研究對這兩者是絕對必要的,如果我們希望得到一些持續的解決方案,在系統的上游設計時間時就應正視與CL/NLP有關的問題。

訪談者:在這21世紀初,亞洲的地位逐漸明顯,特別是中國在全球舞臺上所扮演的角色也越來越重要(文化、政治和經濟等各方面)。因此,我們一點也不驚訝地看到中文成為很熱門的一種外語學習。可是,中文和印歐語言比較起來有很大不同,這些差異有可能會阻礙支持語言學習的CL工具的發展嗎?如果有針對中文的特殊挑戰難題,我們該如何解決這些問題呢?

左密夏博士:關于中文最近在外語學習中很受歡迎,這對一個開通的(Open-minded)人來說是一件很令人興奮的事。其實,我一直以為語言學家們都應該學習一門與自己的母語完全不同的語言。就此觀點而言,中文是一個很好的“候選人”,尤其當我們顧及到它在全球的使用度。學習一個很多人使用的語言顯然是一項很好的投資。我認為中文具有其他語言少有的一些優點。可惜的是,我對中文的了解還很淺薄,但如果我的初步理解是正確的話,中文的詞匯相當具有邏輯性,這是任何語言中一個重要的組成部分。不同于一些西方語言用戶也對自己的語言提出這種說法,中文的確在一定程度上是非常有邏輯的。事實上,中文的詞匯似乎在許多方面類似于本體論(Ontology)(在特定領域中,概念間的關聯分類)。既然語言的功能不限于只做為表達工具,也能進行思考,那擁有一個邏輯結構很強的詞庫也可作為一項資產投資。因此,即使中文在很多方面和西方語言不同,但這并沒有阻止研究學者們針對中文進行CL/NLP的研究。其實在過去的二三十年來,在CL已經有相當的成果(例如臺灣Sinica的語言學研究所)。同時,越來越多人對這種語言會有研究興趣,進而基于研究的結果來研發語言學習/教材工具。關于問題的第二部分,我深信在這領域中真正的研究瓶頸不是語言本身,而是在于語言學習者、教師、語言學家、計算機科學家、心理學家等之間缺乏真正的合作與交流。換言而之,這才是真正的問題所在:更多在于人性層面問題(人與人之間,行政制度的官僚化等),這些障礙都比語言特殊性的困難更不易被解決。

此外,從研究者的角度來看,有些問題是與我們對想要進行自動化處理的學科主題不夠了解有關。例如,哪些知識需要被灌入程序中才能讓它能自動產生有相關性的結果。話雖如此,我仍然認為主要的障礙停留在各類學者專家們不知道如何一起工作,而決策者不夠重視跨學科的研究工作。

訪談者:左密夏博士,我們知道您的背景是心理語言學和認知科學。這兩個學科在語言學習/教學研究和軟件的設計上能有哪些貢獻?

左密夏博士:這兩個學科的領域是很廣泛的,它們涵蓋許多的研究主題并不一定是語言學習方面最為重要的問題。但在另一方面,在它們研究的問題中,也有我們語言領域中極需要做更多清楚了解的問題,例如如何有效學習和記憶、如何索取信息、如何激發/維持學生的學習興趣等等。心理學既可是理論也可是應用的,但它的應用成果工作很少被重視。而且,就像是有良好的科學和無趣的科學一樣,也有很好的應用和沒什么用處的應用程序。我認為,蘋果計算機公司,今天被公認為一個很成功的故事,很明顯地證明了良好的跨學科工作的重要性。他們的工程師一開始便先從用戶的角度來設想,建造一臺為使用者而設計的機器,因此使用者不須花太多的時間來學習使用這臺機器,幾乎是很本能性的。或許科學家和行政人員、決策者們都應該吸取這樣的經驗,偶爾轉個頭,看看語言用戶的需求。有多少次詞典編纂者曾試圖去理解一位字典用戶在查找一個單詞時是如何進行的?為什么他突然停下來,或者為什么繼續、又如何繼續查找?這些都是重要的問題。我們太重視答案及它的正確率,卻忽視了“獎賞”一下好的問題,我們常忘記不適當的問題是找不到答案的,而一個很好的問題常常已經包含形成答案的“種子”。

回到您的問題。心理語言學家和認知科學家對于我們的頭腦、心理(記憶力、注意力等)如何運作很感興趣。而不同于語言學家往往只能看“產品”(單詞、句子),心理學家主要是著重在觀察過程。他們感興趣的是結構(什么組件被儲存)、組件之間的功能性關系(信息流通)等。他們思考觀察起點(輸入:場景、目標)和相對的輸入(想法)和輸出(句子)的中間過程步驟。因為對過程有研究興趣,他們試著揣摩相互對照的圖表:兩個相鄰的級別中間,比如概念和詞語,是如何牽引互動?是否有來自較低層級別(例如聲音)對較高層級別的概念的反饋等等。

很顯然,我們期望這兩個學科能對語言的教學和學習做出直接的貢獻。事實上過去也有不少嘗試,但并沒有很好的效果。我知道的一些很好的方法不是科學家提出的,而是一些擁有豐富的語言學習或語言教學經驗的人提出的。他們不一定是心理學家或科學家,但他們擁有的特質是對語言學習這個主題真正感到興趣,同時也擁有很多的第一手經驗,所以他們的知識是有實證根據的。

這意味著他們曾經認真地嘗試學習一門語言,包括那些和他們母語完全不同的語言。這也可能意味著他們繼續這樣做,學習發展一項新技能,同時也發展了對于學習新語言的寶貴基本知識。因此,他們發展了良好的觀察和分析能力,以反映他們的經驗。這些經驗不是植根于書籍或書本的知識上,而是在語言上的,因為它是作為人在一個具體真實的環境中所活用與使用著的。

訪談者:跨學科及多學科研究對于應用程序與工具的開發在哪些方面有幫助呢?

左密夏博士:從我的角度來看,答案很簡單:即使您本身有很好的直覺和充分的經驗,有時候在研發過程中仍然會需要依賴于您所知不多的元素。假設您是一位做糕點的專家,但這仍然不意味著您知道如何成功地銷售它們。售賣是一種專門知識,和糕點或餅干的創作有極少的相關處。它是與市場營銷、美學、經濟學(如何標出合適的價格)等相關聯的。由此可見,這牽涉到許多不同領域的專門知識。

我拿前面提到的蘋果計算機公司為例。來自Cupertino的工程師很重視人體因素。他們已經創建了一個非常適合人使用的界面。機器的設計考慮配合使用者的習慣。這里面的理念就是由機器,或更確切地說,由它的設計者來配合使用者,而不是由使用者來適應機器。這樣的策略被其競爭對手(微軟)完全忽視,而這幾乎毀了他們。有趣的是,微軟從蘋果的 “配方”(界面)得到了啟發,從那之后,他們再次做得相當不錯。我們所談論的主題跨學科研究是有很多優點的,其中很明顯的兩點就是參與者之間相互交流與豐富彼此的知識與經驗,進而提高最終成果的質量(即正確度的優化)。

訪談者:要把這些想法變成被一般人使用的具體程序有多難?有哪些瓶頸?

左密夏博士:如我先前已有的建議,主要瓶頸既不是缺乏知識,也不是缺錢,主要的障礙是人們的自我中心意識。身為研究者,我們應該保有謙虛的態度。如果想要做的東西的確很好,那就需要時間和真誠投入。您可能始終并沒有成功,但至少您已經盡力了。此外,最后成果歸功于誰并不那么重要(或者,不應該是那么重要)。因為真理是:我們自己有的主意常常是由別人、別處而來的,這是創作的正常過程。

訪談者:正如已經提到的,我們生活周遭充斥著各種“小玩意(Gadgets)”和看似擁有無限可能性的設備與器具。自然語言處理在這些對象扮演什么樣的角色?有什么樣的限制?

左密夏博士:這是一個有趣的問題。的確,在現代生活中,我們周圍常環繞著這些“好的服務與工具”,但大多數人并沒有意識到設計制造它們時是多么困難。當年輕人得到通過復雜計算的外文翻譯時,不要期待從他們的臉上看到驚喜的表情。對年輕的這一代來說,這些都好像很理所當然的事。然而更令人驚異的事實是,雖然我們在理解語言方面有了真正的進展,當涉及到溝通信息時我們仍然可說是遲滯不前與進展不大的。您或許可以將語言說得很好,我的意思是沒有犯任何文法、發音、或選詞的錯,但仍無法清楚地表達自己的意見、想法、或讓對方感動。您可以通過邀請您關心卻不熟的人一起吃晚飯來測試前述的論點。您也可以嘗試是否能成功地讓您的父親、老師、還是警察了解您的觀點,尤其是如果您的看法與他們有很大不同的時候。這已不是語言的問題,而是人文知識的問題。

顯然,語言及其處理是很重要的,但更重要的是溝通的藝術。當然,語言的使用也有其它目的,如數據檢索和信息取得等。從這個角度來看,語言本身是必要的。然而,知識,即取得的信息,不應該是唯一被考慮的成分,如何使用它也是個值得探討的問題。

從長遠來看,我相信不會有太多限制來阻礙計算機科技成功地進行復雜的認知與語言任務的。況且現今似乎已有充分的證據讓人相信某些計算機已經比我們許多人更聰明,他們很快就能超越我們之中大多數人的表現。當然,它們仍然缺乏許多特質,比如一般常識、情緒等,但這些局限性很可能在不太遙遠的將來就能被克服。總之,機器可以在某些領域比人們有更好的執行成果,這事實本身并不是一個問題,因為只要我們對它們仍保有控制能力。然而,這可能不會永久保持不變,我們肯定要學習。機器已經在“控制”我們的生活(例如電視)了,但這該指責誰呢?生活周遭中充斥著眾多噱頭和符號形象,我們出現了變得越來越需要輔助和依賴的現象。我們正在失去越來越多曾經擁有的技巧和能力(記憶、觀察等)。盡管如此,這現象是可以修正的。智慧和哲學應該始終優先于技術,這也就是科技始終來自于人性。

訪談者:謝謝您接受我們的采訪。

[1] J. Aitchison. Words in the Mind: An Introduction to the Mental Lexicon[M]. Oxford and New York: Basil Blackwell, 2003.

[2] J. Aitchison. The Articulate Mammal: An Introduction to Psycholinguistics[M]. London and New York: Routledge, 1998.

[3] G. Altmann. The Ascent of Babel: An Exploration of Language, Mind,and Understanding[M]. Oxford: Oxford University Press, 2012.

[4] C. Boeckx. Language in Cognition: Uncovering Mental Structures and the Rules Behind Them[M]. Chichester: Wiley-Blackwell, 2010.

[5] W. Levelt. Speaking: From Intention to Articulation[M]. Cambridge,Mass: Bradford Book/MIT Press, 1989.

[6] G. Miller and P. Johnson-Laird. Language and Perception[M].Cambridge:Belknap Press, 1976.

[7] S. Pinker. The Language Instinct[M]. Cambridge, MA: MIT Press,1994.

[8] S. Pinker. How the Mind Works[M]. London: Penguin Press, 1997.

[9] L. Vygotsky. Thought and Language[M]. Cambridge, MA: MIT Press,1961.

[10] LT. Language Technology[DB/OL]. http://en.wikipedia.org/wiki/Language_technology, 2015-03-27.

[11] AI.Artificial Intelligence[DB/OL]. http://en.wikipedia.org/wiki/Artificial_intelligence, 2015-03-27.

[12] J. Read. Research in Teaching Vocabulary[J].Annual Review of Applied Linguistics, 2004, (24): 146-161.

[13] T.D. Rudick. Rikai[DB/OL]. http://www.rikai.com/perl/HomePage.pl?Language=Ja, 2015-03-27.

[14] Popjisyo. Read Japanese, Chinese and Korean Web Sites with Popup Hints [DB/OL]. http://www.popjisyo.com/WebHint/Portal_e.aspx,2015-03-27.

[15] C.J. Fillmore. “Corpus Linguistics” or “Computer-aided Armchair Linguistics”[A].J.Svartvik. In Directions in Corpus Linguistics.Proceedings of Nobel Symposium 82.Stockholm, 4-8 Auguest 1991[C].Berlin: Mountain de Gruyter, 1992.35-60.

[16] V. Fromkin, R. Rodman, and N. Hyams. An Introduction to Language[M]. Boston, MA: Thomson Wadsworth, 2007.

[17] M. Gasser, How Language Works: The Cognitive Science of Linguistics[DB/OL]. http://www.indiana.edu/~hlw, 2015-03-27.

[18] A. Radford, R.M. Atkinson, D. Britain, H. Clahsen, and A.J. Spencer.Linguistics: An Introduction [M]. Oxford: Cambridge University Press,1999.

[19] D. Jurafsky and J.H. Martin. Speech and Language Processing:An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition [DB/OL]. http://www.cs.colorado.edu/%7Emartin/SLP/Updates/1.pdf, 2015-03-27.

[20] P.M. Nugues. An Overview of Language Processing [DB/OL]. http://link.springer.com/chapter/10.1007%2F3-540-34336-9_1, 2015-03-27.

[21] CL. Computational linguistics[DB/OL]. http://en.wikipedia.org/wiki/Computational_linguistics, 2015-03-27.

[22] H. Uszkoreit.DFKI-LT - What is Language Technology? [DB/OL].http://www.dfki.de/lt/lt-general.php, 2015-03-27.

[23] H. Uszkoreit. Language Technology-A First Overview[DB/OL].http://www.dfki.de/~hansu/LT.pdf, 2015-03-27.

[24] NLP. Natural Language Processing[DB/OL]. http://en.wikipedia.org/wiki/Natural_language_processing, 2015-03-27.

[25] NLP. History of Natural Language Processing[DB/OL].http://en.wikipedia.org/wiki/History_of_natural_language_processing, 2015-03-27.

[26] J. Allen, Natural Language Understanding[J]. Journal Computational Linguistics,1988, 14(4): 96-97.

[27] R. Grishman. Computational Linguistics: An Introduction. Studies in Natural Language Processing[M]. Cambridge: Cambridge University Press, 1986.

[28] D. Jurafsky and J.H. Martin. Speech and Language Processing[DB/OL].http://www.cs.colorado.edu/~martin/slp.html,2015-03-27.

[29] C.Manningand H. Schütze. Foundations of Statistical Natural Language Processing[DB/OL]. http://nlp.stanford.edu/fsnlp,2015-03-27.

[30] C. Manning, P.Raghavan, and H. Schütze. Introduction to Information Retrieval [DB/OL]. http://nlp.stanford.edu/IR-book/informationretrieval-book.html,2015-03-27.

[31] T. Winograd. Language as a Cognitive Process: Volume I: Syntax[M].Reading MA: Addison-Wesley, 1983.

[32] Clark, C. Fox, and S. Lappin. The Handbook of Computational Linguistics and Natural Language Processing[M]. Oxford: Wiley-Blackwell, 2010

[33] R. Cole, J. Mariani, H.Uszkoreit, A. Zaenen, and V. Zue. Survey of the State of the Art in Human Language Technology[M]. Oxford:Cambridge University Press, 1996.

[34] R. Dale, H. Moisl, and H.L. Somers. Handbook of natural language processing [M]. New York: Marcel Dekker, 2000.

[35] T. McEnery. Computational Linguistics: A Handbook & Toolbox For Natural Language Processing[M]. Wilmslow: Sigma, 1992.

[36] R. Mitkov. Handbook of Computational Linguistics[M].Oxford: Oxford University Press, 2005

[37] S. Bird, E. Klein, and E. Loper. Natural Language Processing with Python– Analyzing Text with the Natural Language Toolkit[DB/OL].http://www.nltk.org/book, 2015-03-27.

[38] P. Blackburn and K. Striegnitz. Natural Language Processing Techniques in Prolog[DB/OL].http://cs.union.edu/~striegnk/courses/nlp-with-prolog/html, 2015-03-27.

[39] M. Covington, M. Natural Language Processing for Prolog Programmers[M]. Englewood Cliffs, N.J: Prentice Hall, 1994.

[40] G. Ingersoll, T. Morton, and A.L. Farris. Taming Text. How to Find,Organize, and Manipulate It[M]. NY: Manning Publication, 2013.

[41] G. Gazdarand C. Mellish. Natural Language in LISP: an introduction to computational linguistics [M]. Boston:Addison Wesley, 1989.

[42] P.M. Nugues. An Introduction to Language Processing with Perl and Prolog[M]. Berlin: Springer, 2006.

[43] G.T.M. Altmann. History of Psycholinguistics[DB/OL].http://www.psycholinguistics.com/gerry_altmann/research/papers/files/encyclopedia.pdf, 2015-03-27.

[44] G.T.M. Altman. The language machine: Psycholinguistics in review[J]. British Journal of Psychology, 2001, (92): 129-170.

[45] H.H.Clark and E.V. Clark. Psychology and language: An introduction to psycholinguistics [M]. New York: Harcourt Brace Jovanovich, 1977.

[46] T. Harley. The Psychology of Language From Data to Theory[M].Essex, UK: Psychology Press, 2008.

[47] M. Christiansen and N. Chater. Connectionist Psycholinguistics [M].Santa Barbara, California: Greenwood Publishing Group, 2001.

[48] Dijkstra and K. de Smedt. Computational psycholinguistics: AI and connectionist models of human language processing[M]. London:Taylor & Francis, 1996.

[49] J. Ingram. Neurolinguistics: An Introduction to Spoken Language Processing and Its Disorders[M]. Cambridg: Cambridge University Press, 2007.

[50] S. Lamb. Pathways of the Brain: The Neurocognitive Basis of Language[DB/OL]. http://www.ruf.rice.edu/%7Elngbrain/main.htm,2015-03-27.

[51] 魏雪峰,宋靈青.學習分析:更好地理解學生個性化學習過程——訪談學習分析研究專家George Siemens教授[J].中國電化教育, 2013,(8):1-4.

[52] J.M.Su, S.S. Tseng, H.Y.Lin, and C.H. Chen. A Personalized Learning Content Adaption Mechanism to Meet Diverse User Needs in Mobile Learning Environment[J]. User Modeling and User-Adapted Interaction(UMUAI), 2011, 21(1):5-49.

[53] S.S. Tseng, P.C.Sue, J.M.Su, J.F.Weng, and W.N. Tsai. A New Approach for Constructing the Concept Map[J]. Computers &Education, 2007, (49): 691-707.

[54] ACL. Association for Computational Linguistics[DB/OL]. https://www.aclweb.org, 2015-03-27.

[55] Anthology. ACL Anthology-A Digital Archive of Research Papers in Computational Linguistics [DB/OL]. http://aclweb.org/anthology,2015-03-27.

[56] ACL Wiki. ACL Wiki Articles and Tutorials[DB/OL]. http://aclweb.org/aclwiki/index.php?title=Research, 2015-03-27.

[57] Neurolinguistics. Lngbrain-Language and Brain: Neurocognitive Linguistics [DB/OL]. http://www.ruf.rice.edu/~lngbrain, 2015-03-27.

[58] S. Clark. Practical Linguistically Motivated Parsing[DB/OL]. http://videolectures.net/clspss09_clark_lspl, 2015-03-27.

蘇俊銘:博士,助理教授,研究方向為適性學習與評量、智能型系統、擴增實境與仿真系統、可視化人機互動、云端及因特網應用(junming.su@gmail.com)。

宋靈青:博士,編輯,副編審,研究方向為信息技術教育實踐與教師專業發展(songlingqing@126.com)。

Editor’s Commentary:Knowledge, i.e. information and its transmission via language are omnipresent in our modern life of the 21st century. People are continuously receiving information, communicating and social networking via their desktops, television sets and mobile devices in work and in their private life. How do we transform traditional static information, for instance, books, newspapers and so on to dynamic data, interpretable in various forms (written/audio/video), accessible at any time, from any where? What are the “inevitable” steps in the process? In order to understand the upstream research for these achievements, we have interviewed Dr.Michael Zock on this topic to glean some of his insights on these topics. Dr. Zock has been active in Computational Linguistics(CL)and Natural Language Processing(NLP)for more than 30 years. He has obtained his PhD in experimental psychology, and has been appointed as tenured researcher by the CNRS (French National Center for Scientific Research). After 20 years working at LIMSI, an Artificial Intelligent Laboratory near Paris, he has joined the NLP group of the LIF (Lab. of Fundamental Informatics)of Aix-Marseille University in 2006.His research interests lie in language production by and large. Starting from user needs and empirical findings (psycholinguistics, neurosciences), he attempts to build tools to help people to acquire the skill of speaking and/or writing. His current research comprise: message-planning, outline planning, lexical access, and the acquisition of basic speaking skills in a foreign language. Dr. Zock is an international well-known researcher in NLP. He has published extensively and some of his publications are considered to be essential for the field. Besides playing a federating role to gather people around an idea(Natural Language Generation, CALL, Cognitive aspects of the lexicon), he has often produced pioneering ideas, most prominently on conceptual authoring, lexical access and language learning (how to learn quickly and painlessly the skill of speaking a foreign langue). His research has often been cited as it has helped to advance the field. Having been invited to Japan and Korea many times, Dr. Zock is currently collaborating with Prof. Jun-Ming Su of the University of Tainan in Taiwan. His stay is financed by a government funding research project in the domain of Foreign Language Learning/Teaching.

Computational Linguistics (CL) and Natural Language Processing (NLP): A Research Field with Impact on Our Modern Life——An Interview with Michael Zock

Su Junming1,Song Lingqing2
(1.Department of Information and Learning Technology, University of Tainan, Tainan Taiwan 70101;2.National Center for Educational Technology, Beijing 100031)

Natural Language Processing; Computational Linguistics; Cognitive Science; Information Retrieval

編者按:在21世紀現代生活中,知識,即信息,通過語言媒介的傳達無所不在。大眾無時無刻在工作場合或私人領域中不斷地通過家庭計算機、電視機和移動通訊設備來接收信息、進行傳播和網絡社交。我們是如何通過各種不同形式(文字/音頻/視頻)將傳統的靜態信息(例如書本與報紙等)轉換成動態數據的,而且在任何時間,從任何地點都能取得?過程中有哪些“不可避免”的步驟呢?為了了解實現這些成果的相關研究,我們邀訪了左密夏(Michael Zock)博士,請他針對此主題根據他的特長及多年來的研究經驗分享見解及看法。

左密夏博士在自然語言處理(Natural Language Processing)和計算語言學(Computational Linguistics)的研究領域已經有30多年的研究經驗。他在獲得實驗心理學博士學位后,被聘任為法國國家科學研究中心的終身研究員。他在巴黎附近的人工智能實驗室LIMSI工作了20多年。自2006年起,在艾克斯馬賽大學(Aix-Marseille)基礎信息學實驗室(Lab. of Fundamental Informatics)的自然語言處理組(NLP Group)工作。他的研究興趣主要在于語言生成領域(Language Production),以用戶需求與實證研究(心理語言學、神經科學)結果為出發點,進行研發與構建工具來幫助語言學習者獲得口語表達和(或)書寫的能力。他目前的研究重點包括:信息規劃(Message Planning)、寫作大綱規劃(Outline Planning)、詞匯存取(Lexical Access)和基礎外語口說技能學習(Basic Speaking Skills Acquisition)。

左密夏博士在自然語言處理研究領域是國際知名學者。他發表了許多研究成果,其中包含該領域中被認為非常重要的研究。他除了積極扮演促進學者間進行各樣主題(如自然語言生成、計算機輔助教學、詞匯的認知特點)交流的角色(如通過舉辦研討會、暑期專題學校、專題工作坊等)外,也經常提出創新想法,尤其是概念創作、詞匯存取和語言學習(如何快速、輕松地學習外語口語表達技巧)。因此,他的研究在該領域中經常被引用。他也曾多次獲得國家研究經費受邀到日本和韓國等國參與長期與短期的專題研究,并于2013-2014年間應邀聘請在臺灣臺南大學與蘇俊銘教授合作研究政府資助的外語學習/教學研究項目。

G434

A

1006—9860(2015)05—0006—08

*本文受科研項目“支持自律學習的適性學習與診斷系統之研究與評估”(項目編號:NSC 102-2811-S-024-001和NSC 101-2511-S-024-004-MY3)資助。

猜你喜歡
語言研究
FMS與YBT相關性的實證研究
2020年國內翻譯研究述評
遼代千人邑研究述論
語言是刀
文苑(2020年4期)2020-05-30 12:35:30
視錯覺在平面設計中的應用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
EMA伺服控制系統研究
讓語言描寫搖曳多姿
新版C-NCAP側面碰撞假人損傷研究
多向度交往對語言磨蝕的補正之道
累積動態分析下的同聲傳譯語言壓縮
主站蜘蛛池模板: 国产精品免费入口视频| 久久成人国产精品免费软件| 麻豆国产精品视频| 亚洲最猛黑人xxxx黑人猛交| 深夜福利视频一区二区| AⅤ色综合久久天堂AV色综合| 欧洲成人免费视频| 国产在线精彩视频二区| 亚洲欧美精品一中文字幕| 国产亚洲精品97在线观看| 国产成人精品免费视频大全五级| 免费人欧美成又黄又爽的视频| 久久香蕉国产线看精品| 婷婷亚洲最大| 免费在线一区| 内射人妻无套中出无码| 亚洲一区网站| 久久久91人妻无码精品蜜桃HD| 在线观看免费黄色网址| 亚洲欧美日韩另类在线一| 亚洲av无码人妻| 制服丝袜 91视频| 亚洲国产成人精品一二区| 国产精品lululu在线观看| 国产69精品久久久久孕妇大杂乱| 亚洲天堂2014| 国产精品自在拍首页视频8| 国产国产人在线成免费视频狼人色| 亚洲性日韩精品一区二区| 综合久久五月天| 精品亚洲欧美中文字幕在线看| 国产精品第5页| 免费一级毛片不卡在线播放| 亚洲av日韩av制服丝袜| 欧美黄色a| 国产香蕉97碰碰视频VA碰碰看| 精久久久久无码区中文字幕| 欧美日韩国产在线播放| 在线观看国产精美视频| 国产精品吹潮在线观看中文| 国外欧美一区另类中文字幕| 日韩黄色大片免费看| 久草热视频在线| 日韩精品无码免费一区二区三区 | 最新亚洲人成网站在线观看| 亚洲大学生视频在线播放| 色爽网免费视频| 亚洲国产第一区二区香蕉| 国产在线麻豆波多野结衣| 欧美一区二区自偷自拍视频| 欧美人与动牲交a欧美精品| 欧美日韩精品一区二区视频| 最新日韩AV网址在线观看| a亚洲视频| 国产夜色视频| 日韩欧美国产综合| 日本高清视频在线www色| lhav亚洲精品| 综合色在线| 麻豆精品在线| 欧美成人精品一级在线观看| 狠狠亚洲五月天| 国产人成午夜免费看| 亚洲天堂网在线播放| 国产本道久久一区二区三区| www亚洲天堂| 国产精品免费福利久久播放| 操美女免费网站| 国产成人高清精品免费软件| www.99精品视频在线播放| 日本成人精品视频| 黄色网页在线播放| 国产在线观看一区二区三区| 永久毛片在线播| 亚洲日韩久久综合中文字幕| 风韵丰满熟妇啪啪区老熟熟女| 在线国产毛片手机小视频| 亚洲精品无码AⅤ片青青在线观看| 2021国产在线视频| 国内丰满少妇猛烈精品播 | 99ri国产在线| 亚洲欧美另类色图|