提 要 中國語言產業的歷史進程可概括為三次浪潮:第一波約始于1990年,是傳統語言產業的快速增長期;第二波約始于2000年,是語言信息技術產業的興盛期;第三波約始于2010年,是“語言信息技術平臺(互聯網、智能手機、語言智能)+語言產業”的發展期。三次浪潮前后呼應、彼此融合,每一波發展都以某種方式匯入新的浪潮之中。第一次浪潮主要由社會開放所致,第二、三次浪潮則為語言信息技術革命所引領。未來語言產業將是“人工語言智能+語言產業”的時代。
關鍵詞 當代中國語言產業;傳統語言產業;語言信息產業;智能語言產業
Abstract Chinas Language Industry has witnessed three waves of development in the past three decades. The first wave appeared in around 1990, a time when the traditional Language Industry experienced a rapid expansion. The second wave started in around 2000, a time often seen as the rise of Language Information Industry. The third wave arrived in around 2010, a period when “language information technology platforms” (e.g., internet, cell phones and language intelligence) became a major media for press, education and speech synthesis. The three waves are three continuous developmental phases, showing the upgrading trajectory of the language industry in China. With regard to the driving forces of such developments, this paper contends that the first wave can be attributed to the opening up of the Chinese society, while the second and the third waves are the results of the revolution of Language Information Technology. It is predicted that the next phase in China will be “Artificial Intelligence plus Language Industry” .
Key words contemporary Chinas Language Industry; traditional Language Industry; Language Information Industry; Intelligence Language Industry
一、前言:中國語言產業的興起
在國內,大約自2010年起,語言產業概念開始引起比較廣泛的關注。我們把語言產業概念初步界定為生產各種語言產品或提供各種語言服務的規模化的產業形態。語言產品則是以語言為內容、材料,或是以語言為加工、處理對象的產品形態。目前,較為典型的語言產業業態主要包括語言翻譯、語言文字信息處理、語言培訓、語言出版、語言能力測評等(賀宏志、陳鵬 2012)。在德國語言技術中心(The Language Technology Center)提供,歐盟翻譯總司2009年發布的《歐盟語言產業規模研究報告》(Study on the Size of the Language Industry in the EU)中,語言產業業態主要包括8個領域:筆譯、口譯、語言技術工具、語言教學、字幕翻譯和配音、軟件本地化、網站全球化和會議組織及咨詢,其概念內涵是以語言翻譯及本地化服務為核心。本文采用的則是以語言產品供給為核心的外延更加廣泛的語言產業概念,它在邏輯上包含相關的所有業態。
從語言產業研究的角度看,語言產業及其相關的語言服務概念興起于歐美。1999年1月美國語言學學會第73屆年會的主題定為:“語言事業:未預料到的機會”(Linguitic Enterprises: Unexpected Opportunities)。在此次年會上,斯坦福大學語言學教授、語音學家Williame Leben做了題為“命名產業”(The Naming Industy)的專題學術報告。美國語言行業協會(the Association of Language Companies,ALC)于2004年起發布年度語言服務行業調查報告。美國卡門森公司(Common Sense Advisory,CSA)自2005年起發布《語言服務全球市場年度報告》(Annual Survey on the Global Language Services and Technology Market),據2005年年度報告顯示,當年全球外包語言服務市場總額預計達88億美元,報告按年均增長率7.5%估算,2006年將達90億美元,2010年將達120億美元。報告發布了全球35強語言服務企業名單及其簡介,中國的海輝公司、統一數位翻譯和傳神聯合信息技術公司榜上有名。在歐洲,瑞士語言經濟學家弗朗斯瓦·格林教授及其團隊2008年的研究表明,語言產業每年為瑞士約創造500億瑞士法郎的收入,約占瑞士國內生產總值的10%。瑞士有著獨特的語言政策和語言環境,德語、法語、意大利語、羅曼什語四種語言都被認定為官方語言,瑞士還是眾多重要國際機構的所在地,巨大的語言需求促成了這樣的產業規模(李宇明 2012)。《歐盟語言產業規模研究報告》顯示,2008 年歐盟成員國的語言市場總產值達84 億歐元,該報告當時預測,歐盟2015年語言市場產值可達到165 億歐元。①
從實際的語言經營活動來說,語言培訓、語言出版、語言翻譯、語言測試早已有之,但國內這些經營活動開始被稱為規模化的語言產業,應該是在20世紀90年代之后。概念反映總比實際事件要滯后一些,從21世紀起,這個業態系統開始作為語言產業引起人們的關注,國內開始有人提及語言產業的概念。2010年前后語言產業概念開始受到較大范圍的關注,一些研究機構成立,一系列研究成果產生(李宇明 2004;黃少安等 2012)。這在一定程度上是因為受到了國外數據信息輸入的影響,但在根本上是國內語言產業發展到一定程度的自然結果。隨著改革開放的歷史進程,語言的基礎性地位、社會文化地位以及市場地位日益突顯,各方面的語言需求被激發出來,中國規模化的語言產業才得以呈現。概括起來,主要有以下幾個方面:
其一,社會的開放與流動激發語言需求。新時期以來中國社會進入一個全新的快速發展期,隨著社會開放程度和活躍程度的加強,語言在社會交往和經濟發展中的作用日益突顯,開放、流動的社會對個人和團體的語言交往不斷提出新的要求。
其二,市場化進程促使語言能力成為一種重要的競爭力。從個體說,語言技能成為一種重要的人力資本,它是個體職業競爭力的重要組成部分。從企業說,語言能力(企業的命名、宣傳、網站、廣告語言設計、說明書等)是一個企業的重要競爭力(徐大明 2010)。
其三,語言類考試的剛性地位決定了語言經濟活動最基本的市場地位。在新的職前職后教育體系中,語文、英語以及其他語言類考試占有相當重要的地位,考試結果直接關乎升學、就業、升職、出國等,由此帶來強勁不衰的語言學習需求。夸張一點說,改革開放以來第一輪語言產業的興起就是由兩類語言考試決定的,一類是與升學有關的中高考中的語文、英語類考試;一類是與出國有關的托福、GRE、雅思等考試。
其四,國際化、全球化進程激發外語需求。隨著全球化進程的不斷深入,各種形式的跨國交流日益頻繁,多語交際能力已成為國家、單位和個人語言能力的重要組成部分。個人和單位出國學習、工作、交流、旅游等需求不斷增加,逐漸引發了一個包括語言培訓、語言翻譯、語言出版、語言測試等業態的具有相當規模的語言產業。
其五,信息化導致新型語言產業的興起。語言技術特別是語言信息技術的發展,改變了語言學習和應用的傳統方法,造就了新型語言產業,使語言產業可以在全新技術平臺上實現新的整合和繁榮。
其六,綜合國力的提升促使漢語的國際化需求迅速增長。海內外以漢語為母語的人大約有13億,漢語是世界上使用人口最多的語言之一,中國綜合國力和國際地位的提升,使漢語具有更重要的文化地位和經濟地位,越來越多的外國人、外國企業開始重視漢語。漢語水平考試已成為世界上最重要的第二語言或外語水平測試之一,美國等許多國家已把漢語作為主要外語納入國民教育體系。
上面的因素聚合起來,加上國內的人口規模和市場規模,中國語言產業的興起和持續增長就成了必然。其中,全球化(多語需求)和信息化(語言技術進步)是兩個最重要的引擎(李宇明 2011)。
值得注意的是,從全球視野看,并非先有一個全球的語言產業,然后中國的語言產業才在它的刺激和影響下興起,實質上是,伴隨著中國社會、經濟的市場化、全球化、信息化進程,中國語言產業的興起勢在必行,中國的市場地位、市場規模以及漢語人口、漢語文化的地位就決定了中國語言產業的市場地位。當然,我們并不否認國外語言產業和語言服務業對中國語言產業的積極影響。
近30年,中國語言產業的發展勢頭一浪高過一浪,表現為三次浪潮。三次浪潮不同于三個發展階段,它們是前一波推著后一波,后一波在某種程度上疊加了前一波的內容,或者說每一波都以某種方式匯入到新的浪潮之中。
二、第一次浪潮(1990年起):傳統語言產業的發展
傳統語言產業業態主要包括語言培訓(面對面課堂培訓)、語言出版(紙質圖書)、語言翻譯(人口翻譯)、語言測試(卷面測試)等,它是指語言信息技術廣泛應用之前的語言產業形態。改革開放以后,市場經濟快速發展,對外開放程度不斷增加,個人和單位的各類語言需求被空前地激發出來,因而導致了中國語言產業的第一波發展,這一波發展的主體是傳統語言產業。在這一波發展中,外語需求最為顯著:一類是個人的外語學習和外語考試需求,它的目標是提升個人的外語能力;一類是企業的外語需求,無論是中方企業“走出去”,還是外方企業“走進來”,都需要專業的多語種服務。以下分別從培訓、出版和測試三個方面加以扼要說明。
(一)語言培訓
自1990年以來,在培訓需求的不斷刺激下,中國培訓市場產生了多元化的產品結構,以語言培訓、電腦培訓和中小學生課外培訓為三大支柱。中國語言培訓自20世紀末開始進入快速增長期,比如,外語培訓第一企業的新東方教育科技集團于1993年11月成立;1994年,李陽創辦國際英語推廣工作室,開啟了“瘋狂英語”的培訓產業進程;著名英語培訓機構華爾街英語于2000年進入中國培訓市場。1995年以后,語言培訓業市場規模每年以20%左右的速度遞增;2010 年,中國語言培訓行業產值已達 300 億元,到 2016 年中國語言培訓行業產值超過800億元。①
新東方的發展歷程可以看作語言培訓在這一波發展中的縮影。1993年俞敏洪創辦了北京市新東方學校。1995年底新東方學員突破1.5萬人次。1998年新東方英語人才培訓體系初具規模并建立實用英語學院。到2000年,新東方學校就已經占據了北京約80%、全國50%的出國外語培訓市場。2003年成立新東方教育科技集團,2006年在紐約證券交易所正式上市,成為中國大陸在美國上市的第一家教育培訓機構。
(二)語言出版
語言出版的快速增長也出現在20世紀90年代后半段。外研社是中國最大的外語出版機構,也是全國規模最大的大學出版社,被認為是“英語圖書市場上真正意義的產業領導者”,其出版地位很大程度上就是靠這一階段的迅猛發展來奠定的。從1991年到2005年,外研社發行碼洋從1000多萬元增長到13億元。目前,它旗下有九大分社、12個獨立法人企業,以及分布全國的16個信息中心。《英語周報》的輝煌歷程更是報業出版的一個傳奇,這個誕生于山西師范大學的曾經的英語小報,自20世紀90年代以后,每年的發行量都上一個新臺階,1995年他們在同行業中率先自辦發行網絡,創新發行體制,至2000年它的期發行量已突破千萬。2006年,《英語周報》達到1600多萬份的期發行量巔峰,此后開始下降。同樣誕生于山西師范大學的《語文報》系列產品覆蓋了語文教學的各個層次,它鼎盛時期的期發行量也逾500萬份。綜合書、報、刊,保守估計,2005年全國語言出版的產值應該接近100億。
(三)語言測試
由于升學、出國、評職稱等的剛性需求,相關語言測試也就越來越火爆。托福、雅思、GRE等在中國市場不斷膨脹;英語四、六級的考生規模也是逐年遞增。同時,隨著中國經濟實力的不斷提高以及“軟實力”的增長,“漢語熱”開始在全世界范圍流行開來,對外漢語測試也發展迅速。可以說,各種語言測試的不斷發展催生了一個新型測試產業。
據《中國教育考試年鑒》,“十一五”規劃(2006—2010)期間,參加海外考試的考生達到455萬人,相當于 “十一五”規劃前整個海外考試歷年考生人數總和的1.4倍。以雅思考試為例,自1989年雅思進入中國,迄今已28年,參加雅思考試的中國考生數量逐漸遞增(見圖1)。據統計,2013年共有超過35萬人次在中國參加雅思考試。
另一個大規模的英語類考試是大學英語四、六級考試,該考試于1987年開始,當時每年只有10萬人次,至2000年就已發展到500萬人次,2010年接近1800萬人次。與此同時,海外漢語水平測試(HSK)的規模也逐年增加:2008年,海外考試規模為67 558人次,到2009年為76 088人次,增長幅度為12.63%(羅民等 2011)。
總體上說,傳統語言產業的這一波發展浪潮大致起于1990年,在2005年前后達到高峰。之后,它雖然仍有一定的規模性增長,但從宏觀上來看,傳統形態的語言產業已經增長乏力,如紙質出版、面對面的課堂培訓、人工翻譯以及卷面測試等產業形態已經不可能對語言產業的內部結構產生根本性影響,也很難激發出新一輪的語言需求。
語言產業的發展并未止息,與這一波浪潮相隔不久,由于語言信息技術的全面開發和應用,語言產業很快迎來了新的興盛時期。
三、第二次浪潮(2000年起):語言信息技術產業的興盛
中國是幸運的,近30余年中國產業的發展趕上了信息化和全球化雙重歷史機遇,在這個歷史進程中,信息技術和信息產業塑造了全球產業的基本結構和總體走向。對于語言產業來說,信息技術的影響直接且深刻,因為任何一種語言技術都是信息技術,反過來,信息技術的基礎性領域還是語言技術。傳統的語言技術不過是紙、筆、圖書,再好一點的就是打字機、話筒、錄音機、投影儀之類,而隨著計算機、網絡平臺和移動終端技術的產生和發展,語言技術也迎來它的信息化時代,使得我們習得語言、運用語言的方式均發生了革命性的變化。如果說語言產業的第一次浪潮主要是社會開放、語言交往的直接需求所導致的,那么語言產業的第二次浪潮則是語言信息技術革命所引領的。
簡要地說,語言信息技術是運用計算機技術、網絡技術、數字化技術以及移動技術等現代信息技術來處理自然語言的技術。從語言要素的角度,語言信息技術大致可以分為以下幾種類型:(1)語料技術:對語言材料(字詞、語段、語篇等)進行分類、整理、檢索、貯存等處理的技術;(2)語形技術:將文字作為圖形的信息處理技術,如文字輸入、語形識別等;(3)語音技術,對語音進行信息處理的技術,如語音識別、語音合成等;(4)語義技術,對自然語言進行內容處理的信息技術,如機器翻譯、自動文摘、人機對話等,語義技術是人工智能的關鍵環節;(5)語言綜合處理技術,如語言能力測評、語言機能康復等。因此,所謂語言信息技術產業就是運用計算機、網絡等信息技術對自然語言進行信息化處理和運用的產業形態,在這個產業形態中,語言信息技術及設備本身就是語言產品。以下我們以輸入法、智能翻譯、語音處理為代表來描述這一波語言信息產業的新浪潮。
(一)輸入法產業
從20世紀80年代中期到90年代末,中文信息處理研究進入了一個萬“碼”奔騰的時期。在聯想漢卡、四通中文電腦打字機之后,五筆字型、鄭碼、自然碼、智能ABC、拼音輸入法等不斷涌現。也正是從這個時期開始,中國的漢字輸入法產業逐漸形成規模,進入了繁榮發展期。進入21世紀以后,輸入法從電腦時代進入手機時代,迎來了新一輪爆炸式增長。工信部的統計數據顯示,2001年,中國手機用戶1.45億,此后幾乎每年都以近億的速度快速增長,截至2014年5月底,中國的手機用戶數量已達到12.56億人,相當于中國90.8%的人都在使用手機,其中手機網民的規模十分驚人(見圖2)。2015年,中國手機市場銷量3.86億部,再加上個人電腦每年近億的出貨量,這樣的數量意味著龐大的輸入法市場。有人估計,基于輸入法整合的手機應用平臺所產生的相關收入將高達8000億元。①
十多年之前,80%以上的手機植入的漢字輸入法的知識產權屬于外國公司,中國企業每年需為此支付6億至7億元專利費,被稱為“洋碼奔騰”。經過十多年的努力,這種情況已大有改觀。搜狗、百度、訊飛、QQ等輸入法均表現不俗,搜狗輸入法在2009年的裝機量已過億。作為首家支持語音輸入的輸入法,豐富的語音功能已成為訊飛輸入法的獨特標志。近期,訊飛輸入法的語音識別率提升至98%,可以適應不同場景,不同語速、音高,而且支持21種方言,訊飛輸入法越來越受到用戶的青睞。在移動互聯領域,訊飛輸入法用戶達4億。③
(二)智能翻譯產業
傳統翻譯是人工翻譯,主要是口譯和筆譯。計算機的出現促使人們探索新的翻譯技術,可以稱之為機器翻譯。到20世紀70年代,機器翻譯的技術日趨成熟,基于統計和實例的機器翻譯逐漸替代了過去簡單的語言字面轉換。最近二三十年來,隨著計算語言學的發展,計算機處理語言的能力不斷增強,翻譯技術有了顯著的發展和進步。最新的翻譯技術已經是計算機輔助翻譯、翻譯語料庫、大數據、云翻譯、語音語義處理等的信息技術整合,可以稱之為智能翻譯。智能翻譯技術對傳統翻譯形成很大沖擊,當前幾乎再也找不到一家大型翻譯公司可以完全依賴于傳統作坊式的翻譯模式而成功運作。在此,我們以文思海輝和中國傳神兩家公司為例簡要描述這一歷程。
1995年,文思海輝公司成立。隨著第一批跨國科技企業陸續進入中國,IT服務市場開始出現語言翻譯服務需求,文思海輝抓住機遇,將公司的語言服務從最初單一的中文擴充到如今囊括亞、非、拉、歐美主要語種的147種語言,從基礎的語言翻譯擴展到如今涵蓋本地化咨詢、技術研發、內容翻譯和營銷、測試、語音轉錄、商務會議同傳等一站式服務體系;服務團隊從最初的20人發展到今天分布在100多個國家的10 000多人。其產值從2009年9億美元提高到2013的36億美元。美國著名語言調查機構卡門森公司的研究顯示,2009至2016年,文思海輝連續八年入選“全球語言服務企業25強”,位列中國第一、全球第十六。
2005年3月,傳神公司成立,同年成功開發中國首個基于互聯網的協同翻譯及流程管理平臺系列軟件。2010年,傳神公司打造“云翻譯服務平臺”,公司總部正式遷入武漢,建立中國第一家翻譯產業園——“全球多語言處理中心”。公司通過互聯網技術和產品建立網絡化的語言服務平臺——“語聯網”,該平臺整合中國乃至全球的個人譯員和翻譯機構等各種翻譯資源,將用戶的語言需求分類聚合,借助語聯網平臺的智能基因匹配技術,將需求和產能進行快速精準的分層對接,向用戶輸出各種不同種類的高質量的語言服務或產品。2012年產值突破80億元。據市場調查報告顯示:目前傳神(中國)網絡技術有限公司已經成為亞洲第七、全球第三十三的語言服務供應商。傳神公司表示,計劃用3年時間,成為全球最大的中文翻譯服務提
供商。①
(三)智能語音產業
從語言技術的角度講,語言信息產業的最高級形態就是語言智能產業,而語音智能產業是它的重要支柱,現稱智能語音產業。智能語音產業是指以智能語音技術為核心,提供智能語音技術、產品和服務的產業形態。智能語音技術主要包括語音增強、語音合成、語音識別、自然語言處理和理解等技術,特別是相關人機自然對話技術的發展突破了傳統語音技術的范圍,為其在日常生活中的應用打開了無限廣闊的空間。中國智能語音產業起步時間基本上與國外同步,以語音識別技術研究開發為起點,大致經歷了技術萌芽階段(20世紀 50—70 年代)、技術突破階段(20 世紀 80—90 年代)和產業化階段(20 世紀 90 年代末—21 世紀初)。自20世紀90年代末,科大訊飛、捷通華聲等智能語音企業相繼成立,智能語音技術逐步在通信、交通、教育、金融、郵政、電力等各行業推廣應用,開啟了國內智能語音的產業化時代。根據工信部的數據,2011至2015年中國智能語言產業規模每年都有較高增長(見圖3)。
科大訊飛公司的發展歷程可謂中國智能語音產業發展的一個縮影。1999年,科大訊飛公司成立。2001年11月,訊飛推出第一塊語音合成單芯片,同年12月,又推出了具有語音合成和語音編解碼功能的板卡。在公司成立后的短短3年時間內,訊飛就獲得了國內電信、證券等語音合成技術主流應用市場80%的份額。2007年,科大訊飛成功上市,成為中國語音產業的唯一上市企業。 2009年,科大訊飛實現營業總收入3.07億元,同比增長19.25%;2010年實現營業總收入4.36億元,比2009年增長41.98%。正是由于以科大訊飛為代表的一批國內語音企業的崛起,以及信息技術發展進程中“智能語音時代”的來臨,2012 年 8 月在工信部指導下,中國智能語音產業聯盟正式成立,這是中國語言信息產業發展史中的一個里程碑。
我們正著手收集、整理2010年以來中國整體語言產業的發展狀況,這個“語言產業整體”力圖涵蓋語言出版、語言培訓、語言翻譯、語言信息、語言測試等多個語言產業業態并且盡可能明確這個產業的基本邊界。當然,無論是厘清邊界,還是獲取數據都非常困難。以2010年為例,據估算,國內包含語言翻譯、語言培訓、語言出版、語言信息技術等的整個語言產業的總產值應不少于2000億。其中嚴格意義上的語言信息技術產業應不少于300億,至于其他與語言信息技術應用直接相關的語言教育、語言出版等產值應占有更大的比例(陳鵬 2016)。
四、第三次浪潮(2010年起):基于全方位語言信息技術的語言產業
一波未平,一波又起,在語言產業的第二次浪潮和第一次浪潮之間產生融合效應之后(不是簡單疊加),當互聯網技術和智能手機終端深度整合成新的應用平臺時,便催生了語言產業發展的第三次浪潮,即基于全方位語言信息技術平臺的語言產業,換一種說法就是專業語言服務或語言產業的信息化時代。語言信息技術的發展首先是催生了新型的語言信息產業,諸如輸入法產業、智能語音產業、機器翻譯產業、語義智能產業等;同時,這些語言信息技術不斷滲透到培訓、出版、翻譯、測試等傳統語言產業之中,形成一個基于現代信息技術的語言產業形態;尤其是互聯網技術和智能手機終端的廣泛應用,使得語言產業的新一輪發展不再是規模性數量上的增長,而是質的變化。與傳統語言產業相比,我們可以把這個基于信息技術的語言產業稱為語言產業2.0版。這一波浪潮將長期引領語言產業的發展。下面我們以數字出版、在線語言教育以及“語音智能+”為例來說明這一輪語言產業的發展。
(一)數字出版
受益于互聯網特別是移動互聯網、移動終端的全面應用,中國數字版權產業蓬勃發展,年增長速度穩居30%之上,遠遠超越了其他行業。根據中國出版科學研究所《2015年度中國數字出版產業年度報告》的統計, 2009年中國數字出版業總值達795億元人民幣,首度超越傳統紙質書、報、刊出版物的生產總值。到2015年中國數字出版產業整體收入規模為4403.85億元,其中包括移動出版(手機彩鈴、鈴音、移動游戲等)、網絡游戲、互聯網期刊、電子書、數字報紙(不含手機報)、在線音樂、在線教育等。當然,這是廣義的出版行業,游戲、廣告、鈴音也占據相當大的份額。需要注意的是,2015年互聯網期刊、電子圖書、數字報紙的總收入只有74.45億元,在數字出版總收入中所占比例僅為1.69%,這說明傳統出版行業在數字化融合發展、數字化轉型升級方面仍有巨大的增長空間。
有數據顯示,人們的閱讀方式正在發生根本性的變化,調查顯示:2014 年,以手機閱讀、網上在線閱讀為代表的數字化閱讀方式的接觸率為58.1%,較2013 年上升了8.0 個百分點,首次超過了圖書閱讀率。①這在相當程度上說明了數字出版方式將逐漸取代傳統紙質印刷出版而成為主流出版方式。
在語言出版領域,語言工具書的出版一直占有相當大的份額,有些金牌工具書甚至被比喻為印書如印鈔,但是它仍然要應對數字化出版。隨著智能手機全覆蓋式的普及以及在線工具書的使用,紙質工具書的地位不斷下降。比如,2008年至2010年間,上海譯文出版社的《新法漢詞典》年銷量從13 000冊下降到3000冊。根據開卷公司的調查,2013年紙質工具書銷量比去年下降5%,除了中小學生常用的《新華字典》《現代漢語詞典》銷量平穩以外,語言類工具書總體下降9.2%,外文工具書總體下降9.3%。外研社有關人士也提到該社紙質字典銷售呈逐年下降之勢,年均下降7%至8%。越來越嚴峻的現實逼迫傳統工具書進行數字化變革。商務印書館《新華字典》紙質圖書發行量迄今已有近6億冊,但它仍不能高枕無憂。在國內出版社中,商務印書館較早著力于數字化出版的打造。2006年商務印書館與方正集團合作啟動“工具書在線”,為自己豐富的工具書資源打造數字化平臺。商務印書館可以提供總計1000余種工具書,商務版工具書的權威性和專業性都是不容置疑的,這些數字資源可以提供在線使用、電子書、資源庫、手機APP等多種服務。目前商務印書館數字出版的利潤當然無法與傳統出版相比擬,但前景是無比開闊的,作為中國現代出版發源地的商務必須跟上時代的步伐。
一些信息企業正在成為另一種意義上的出版企業。以方正集團為例,2000年起,在漢字激光照排技術的基礎上方正集團著手研發適應互聯網時代的數字出版系統。2007年,方正集團發布數字出版戰略,向全媒體的數字復合出版技術發展,積極研發包括數字印刷、手持閱讀、互聯網出版等在內的數字復合出版技術,被稱為方正的“第二次技術革命”。方正阿帕比(Apabi)公司已發展成為全球領先的數字出版技術提供商,阿帕比以因特網為紐帶,將傳統出版的供應鏈有機地聯結起來,實現完全數字化的出版。
(二)在線語言教育
在線教育是一種通過信息科技和互聯網進行教育和學習的方法,在線教育的顯著特征是任何人在任何時間、地點,選擇任何課程,從任何章節開始的一種完全超現實的學習或教育方法。它超越了課堂、教室、書本等實體條件的限制,帶來一種非常自由、靈活的學習狀態。在線教育改變了人們的學習方式,尤其是自主學習這一塊。在語言教育這一領域,艾瑞咨詢公司的調查顯示,在線語言學習正在成為語言學習的主流方式(見圖4)。
據該公司的調查報告,2010 年之后,在線語言教育市場每年都保持高于 20%的增長速度,到 2017 年將達到 360億元。2016 年中國在線語言培訓占互聯網教育市場份額的21%,在投資領域,語言培訓占據 35% 的市場份額。報告顯示,至2016年,80%的用戶選擇通過智能手機進行語言學習,智能手機已成為在線語言學習的第一終端工具,用戶比例已超過PC終端(見圖5)。在線語言培訓已與傳統語言培訓分庭抗禮,它遲早會取代后者而占據主流地位。
(三)“語音智能+”
根據《2013年智能語音產業白皮書》的介紹,目前智能語音完整的產業鏈基本形成,智能語音技術已在移動互聯網語音搜索服務、智能手機、平板電腦等移動終端設備、汽車電子和車載終端、智能家電、智能家居等方面得到廣泛應用。同時,智能語音技術應用及服務在公共服務、智慧城市、教育、醫療、法律等領域不斷滲入,市場前景無可比擬。僅從智能手機終端來看,預計到 2017 年底,全球移動終端 90%以上將配備語音功能,智能語音用戶規模將超過 20 億,其中中國用戶規模達將達到 10 億。
以科大訊飛的語音智能發展為例。它始終包含兩個線索,一是語音技術的發展,一是語音技術的廣泛應用所帶來的產業整合效應。科大訊飛起家的核心技術是語音識別、語音合成和語音評測,目前占有中文主流語音市場70%以上市場份額。隨著人工智能時代的來臨,2014年,科大訊飛發布“訊飛超腦”計劃,核心就是讓機器從“能聽會說”到“能理解會思考”,努力實現語音處理和語義智能的融合。在語音識別和語義理解方向上,針對人與人之間自由交流的語音轉寫正確率已突破85%的實用門檻,針對會議演講等實際場景應用已達到95%以上的識別率,并且已經研制完成軟硬件一體化的遠場語音識別系統。在機器評測方向上,訊飛的技術從口語評測進一步向紙筆試卷評測延伸,在正式承擔了廣東英語高考的全部口語評測任務后,基于試卷掃描識別的中英文作文自動評分技術在重點考試的實際數據驗證上已達到與人工專家評分高度吻合的水平。此外,其語音—語義智能技術在醫療、汽車、法院、電視娛樂等許多方面都有應用。
隨著萬物互聯時代的到來,越來越多的設備沒有屏幕了,越來越多的設備需要我們在幾米之外來操控它,比如說機器人,它必須在幾米之外能夠實現交互,并能夠隨時打斷。在這種大趨勢下,語音聯通將是重要入口,語音合成和識別就成為萬物互聯時代人機交互的最主要的方式。2016年底,科大訊飛首先在發布會上提出信息產業已經從“互聯
網+時代”進入“人工智能+”時代,訊飛認為,未來5到10年,人工智能會像水和電一樣,進入我們每個人的生活。
從全球角度看,中國的語言產業進程基本與世界同步,這主要是因為中國抓住了全球化、信息化的產業發展機遇。從語言產業的內在進程看,語言產業的發展就是與信息技術不斷融合的過程。由于自然語言本身就是一種信息形態,導致語言產業的“信息技術+”與其他產業的“信息技術+”有著根本的不同。語言產業的最新發展將圍繞人工語言智能展開。從技術的角度,人工智能是一種用智能機器(如計算機、翻譯機器、機器人等)來模擬人的某些思維過程和智能行為(如學習、推理、思考、規劃、行為活動等)的技術;從計算機科學的角度,人工智能研究包括語言識別、圖像識別、自然語言處理、核心算法、專家系統和機器人等。可以看出,語言智能是人工智能的重要組成部分,甚
至是基礎性的部分。從實際應用的角度,使用自然語言的人機對話將是未來萬物互聯的基本方式,人工智能不僅會聽會說我們的語言,而且能最大限度地模仿和聚合我們的語言智能。不同形態的語言產品都將不同程度地融入語言智能這一新的技術平臺,未來語言產業的發展無疑將是“語言智能+”的時代。
參考文獻
陳 鵬 2016 《語言產業經濟貢獻度研究的若干理論問題》,《語言文字應用》第3期。
賀宏志主編 2012 《語言產業導論》,北京:首都師范大學出版社。
黃少安 蘇 劍 張衛國 2012 《語言經濟學與中國的語言產業戰略》,《光明日報》3 月2日。
李宇明 2004 《強國的語言與語言的強國》,《光明日報》7月28日。
李宇明 2011 《語言也是硬實力》,《華中師范大學學報》(人文社會科學版)第5期。
李宇明 2012 《認識語言的經濟學屬性》,《語言文字應用》第3期。
羅 民 張晉軍 謝歐航 黃賀臣 2011 《新漢語水平考試(HSK)海外實施報告》,《中國考試》第4期。
徐大明 2010 《關于語言經濟學的七個問題》,《云南師范大學學報》(哲學社會科學版)第9期。
責任編輯:戴 燃