■陳媛媛
(鄭州經(jīng)貿(mào)學院,河南 鄭州 451191)
2021年5月31日,習近平總書記在中共中央政治局第三十次集體學習時就加強我國國際傳播能力建設發(fā)表重要講話,分別就“河南省國際語言環(huán)境和國際化語言能力建設”和“中原文化國際傳播”等專題進行交流研討[1]。外語數(shù)據(jù)標注是河南省國際語言環(huán)境和國際化語言能力建設以及中原文化國際傳播研究的重要方法,是“數(shù)字河南”建設的重要一環(huán),也是河南省首創(chuàng)實施“翻譯河南”工程、高標準構建地方對外話語體系的重要支撐。數(shù)據(jù)標注作為人工智能的基礎環(huán)節(jié),對于推動產(chǎn)業(yè)集聚發(fā)展、培育人工智能產(chǎn)業(yè)、促進經(jīng)濟結構轉型具有重要意義[2]。
黨的十九大提出,我國經(jīng)濟已由高速增長階段轉向高質量發(fā)展階段。外語數(shù)據(jù)標注行業(yè)也處在轉變發(fā)展方式、優(yōu)化產(chǎn)業(yè)結構、轉換增長動力的攻關期,外語數(shù)據(jù)標注行業(yè)發(fā)展模式從“新”變成“新常態(tài)”。然而在“前常態(tài)”下,外語數(shù)據(jù)標注發(fā)展粗放、生長野蠻,逐漸進入穩(wěn)定的成長發(fā)育期。隨著市場對于外語數(shù)據(jù)的新要求,外語數(shù)據(jù)標注已不是簡單地“拉框打點”。2019年,河南升入數(shù)字中國省級排名第6位[3]。大數(shù)據(jù)背景下河南語言服務產(chǎn)業(yè)缺乏科學的規(guī)劃和專業(yè)指導,缺乏創(chuàng)新能力和國際影響力[4]。然而,絕大部分從事外語數(shù)據(jù)標注的公司被勞動密集型問題所困擾,無法破圈。需求方對行業(yè)期望不斷降低,頭部企業(yè)和下游的供應商在痛苦中掙扎生存。外語數(shù)據(jù)標注行業(yè)要轉向要素驅動和需求方驅動,結合產(chǎn)業(yè)融合的新趨勢,關注經(jīng)濟發(fā)展的環(huán)境生態(tài)、集約持續(xù)和轉型升級而不斷優(yōu)化,著眼于外語大數(shù)據(jù)的精益化生產(chǎn),為實現(xiàn)智能化技術創(chuàng)新與突破而有所作為。
2016年,河南獲批成為全國8個大數(shù)據(jù)綜合試驗區(qū)之一。河南省國家大數(shù)據(jù)綜合試驗區(qū)的核心區(qū)鄭東新區(qū)智慧島、高新區(qū)大數(shù)據(jù)產(chǎn)業(yè)園和鄭州航空港經(jīng)濟綜合實驗區(qū)國際智能終端大數(shù)據(jù)產(chǎn)業(yè)園的新建以及“1+18”的發(fā)展空間格局,吸引了國內(nèi)外知名企業(yè)機構集聚河南;跨境電商與共享經(jīng)濟等新型服務模式的崛起呼喚有效的外語數(shù)據(jù)采集和“高質精準”的外語數(shù)據(jù)標注。目前,河南省數(shù)據(jù)標注行業(yè)為客戶群體提供的外語數(shù)據(jù)標注產(chǎn)品的類型大體分為特定設備、文字圖像、語種、方言、定制五類。在數(shù)據(jù)標注過程中經(jīng)常出現(xiàn)以下問題。第一,外語數(shù)據(jù)的采集和語料資源分散、標注方案各異、缺乏科學的標注規(guī)則規(guī)范和數(shù)據(jù)產(chǎn)品質量評估標準。數(shù)據(jù)采集和標注服務還保持著一定的壁壘[5]。第二,底層標注技術是外語數(shù)據(jù)標注發(fā)展的基礎,因此標注師的素質從本質上決定人工智能的落地水平。大量的語言能力薄弱的“勞工”和“富士康”式[6]的“最不智能、最沒有技術含量”的企業(yè),造成了“淘金”企業(yè)AI的“不靈光”。第三,缺乏各種場景化、領域性數(shù)據(jù)的專門的外語數(shù)據(jù),這些數(shù)據(jù)是需求方之急需,AI對數(shù)據(jù)的質量、規(guī)模和個性化方面的高標準決定了數(shù)據(jù)標注企業(yè)高質量的發(fā)展才能為人工智能按下加速鍵。
河南省外語數(shù)據(jù)標注行業(yè)發(fā)展仍然處于勞動密集型而非技術密集型,這與行業(yè)高質量發(fā)展的目標相悖而行。據(jù)《財經(jīng)》報道,翊澳數(shù)據(jù)公司之類的數(shù)據(jù)標注公司,以“租金低、工資低、更省成本”為特點,在河南的十幾個縣市建立數(shù)據(jù)標注工廠,通過線上和線下結合的方式,讓數(shù)據(jù)標注行業(yè)成為“富士康”式勞動密集型產(chǎn)業(yè)。標注平臺、工具和轉包模式也是制約數(shù)據(jù)標注行業(yè)高質量發(fā)展的重要因素。作為人工智能發(fā)展的三駕馬車之一的數(shù)據(jù)標注行業(yè)如何隨著應用端的業(yè)務復雜度增加、需求多樣化向專業(yè)化、高質量的方向發(fā)展,滿足客戶數(shù)據(jù)需求,提升AI競爭力,跳出“數(shù)據(jù)標注員的工作是最不智能、最沒有技術含量的”論斷,需要提升數(shù)據(jù)標注人員的整體技術水平,以達到實現(xiàn)行業(yè)高質量發(fā)展的目的。
《2018—2024年中國數(shù)據(jù)標注市場分析與發(fā)展趨勢研究報告》提出,人工智能將成為推動經(jīng)濟高質量發(fā)展的重要引擎,頭部數(shù)據(jù)標注企業(yè)功不可沒。數(shù)據(jù)標注是大部分人工智能算法得以有效運行的關鍵環(huán)節(jié)[7]?,F(xiàn)代人工智能主要算法應用領域集中在計算機視覺、語音識別與語音合成以及自然語言處理三個方面,依賴各種算法處理規(guī)模達數(shù)百萬的示例、圖像或文本素材。就外語數(shù)據(jù)標注而言,語音語義標注較圖像標注發(fā)展較為成熟,而自然語言處理有望成為繼圖像、語音之后的第三大增量市場。隨著外語AI產(chǎn)品個性化需求量的大幅度提升,對自然語言產(chǎn)品的需求也會進一步增加。
有多少智能,就有多少人工[8]。數(shù)據(jù)標注催生出來新行業(yè)、新崗位。2020年7月26日,國家發(fā)展改革委等13個部門聯(lián)合發(fā)布《關于支持新業(yè)態(tài)新模式健康發(fā)展激活消費市場帶動擴大就業(yè)的意見》,“人工智能訓練師”正式成為職業(yè)“萌新”[9]。外語數(shù)據(jù)標注,與漢語數(shù)據(jù)標注相比,工作量更大、過程極其枯燥且更耗時。海量的數(shù)據(jù)幾乎全部依賴數(shù)據(jù)標注師手工進行標注,行業(yè)缺口可觀。就河南省而言,隨著外語應用場景多領域化,從業(yè)者也必將進入細分市場追逐階段,外語數(shù)據(jù)標注師呼之欲出。然而,外語能力強且懂標注技術的標注師質量的參差使外語標注行業(yè)機遇與挑戰(zhàn)并行。因此,商務英語專業(yè)可以加大融合性跨學科商務英語人才的培養(yǎng),培養(yǎng)學生大數(shù)據(jù)和量化思維能力,提升學生思辨能力和創(chuàng)新能力。
需求專業(yè)化倒逼人才素養(yǎng)的提升[10]。“人、物、場”在河南融合,數(shù)字經(jīng)濟在這里激蕩出萬千氣象,外語數(shù)據(jù)標注成為發(fā)展基石。當前河南在外語數(shù)據(jù)標注和數(shù)據(jù)產(chǎn)業(yè)的發(fā)展上還存在很大的進步空間。河南在外語數(shù)據(jù)產(chǎn)業(yè)的發(fā)展上潛力巨大,成為數(shù)字河南高質量發(fā)展的增長點,帶動了城市和城鎮(zhèn)的就業(yè),也成為緩解行業(yè)供求關系緊張以及大學生就業(yè)壓力的有效辦法之一。據(jù)筆者統(tǒng)計,河南省2021年外語數(shù)據(jù)標注供應商共有36家企業(yè),其中近一半成立于2020年,河南數(shù)據(jù)標注供應方僅占全國的3%,說明了河南市場正向而積極發(fā)展的態(tài)勢。外語數(shù)據(jù)標注公司能夠在一定程度上緩解河南大學生就業(yè)難的問題。作為“外向型經(jīng)濟發(fā)展”的重要基石,河南省外語數(shù)據(jù)標注行業(yè)必將有巨大的發(fā)展空間,從而為外語類專業(yè)和語言能力較強的大學生提供大量就業(yè)機會和技術紅利。隨著人工智能技術發(fā)展和創(chuàng)新形態(tài)演變,商務英語專業(yè),作為融合性與國際化的應用型代表,在學生綜合素質發(fā)展和就業(yè)方面的特殊地位進一步凸顯。培養(yǎng)語言能力強、數(shù)據(jù)標注精、標注技術高的復合型、應用型商務英語專業(yè)數(shù)據(jù)標注人才,對河南經(jīng)濟高質量發(fā)展至關重要。
加強跨學科“雙師”團隊與“雙創(chuàng)”教師團隊的建設是人才培養(yǎng)的關鍵。人工智能背景下,要注重對商務英語專業(yè)人才的融合式培養(yǎng)。因此,擁有“雙師”以上跨學科知識背景的師資隊伍能夠占據(jù)競爭優(yōu)勢。高校應該注重復合型外語專業(yè)的建設和培育。以鄭州經(jīng)貿(mào)學院商務英語專業(yè)為例,學校要創(chuàng)新“評價機制”激發(fā)教師工作的積極性,建立一套行之有效的教學技能培訓機制,積極引導教師參加各類培訓、講座和學術性會議,鼓勵教師深入企業(yè)進行見習和社會實踐。加強現(xiàn)代化技術、大數(shù)據(jù)及網(wǎng)絡技術在教學及教科研中的應用,加速成果的轉換。
同樣,培養(yǎng)商務英語專業(yè)應用型外語數(shù)據(jù)標注人才離不開“雙創(chuàng)”教師的培養(yǎng)。鄭州經(jīng)貿(mào)學院著力打造“雙創(chuàng)”型商務英語“雙創(chuàng)”教學團隊,著力培養(yǎng)學生創(chuàng)新創(chuàng)業(yè)的能力。在提升教學質量的同時完善創(chuàng)新創(chuàng)業(yè)政策和教學成果獎勵辦法,規(guī)定“雙創(chuàng)”獲獎作為職稱評定和評優(yōu)評先的重要依據(jù)。
優(yōu)化應用型人才培養(yǎng)方案,重構應用型課程體系是應用型人才培養(yǎng)的核心。人工智能發(fā)展對就業(yè)崗位產(chǎn)生了深遠的影響[11],高質量人才能夠滿足經(jīng)濟社會發(fā)展的需求。高校要定位于培養(yǎng)能夠服務于區(qū)域社會經(jīng)濟和產(chǎn)業(yè)行業(yè)發(fā)展的應用型人才,才能夠在激烈的競爭中屹立不倒。因此,河南省外語數(shù)據(jù)標注人才培養(yǎng)應該強調對學生實踐能力和創(chuàng)新能力的培養(yǎng),并拓寬其國際化視野。
在重構應用型課程體系方面,河南省應用型本科高校主要采取三種構建課程體系的方式:一是模塊課程結構,二是模塊+平臺課程結構,三是通識教育+專業(yè)教育課程結構[12]。從教學內(nèi)容和課程上看,商務英語專業(yè)構建了“多位一體”的應用型課程體系和跨學科人才培養(yǎng)體系,加大“數(shù)據(jù)標注員”“數(shù)據(jù)標注師”培養(yǎng)。提高語言課程、數(shù)據(jù)課程和計算機課程的“質”和“量”,加深學生對大數(shù)據(jù)、信息管理等知識的認知,開啟學生運用Excel、SPSS等工具進行統(tǒng)計分析研究的大門,為外語數(shù)據(jù)標注打下基礎。商務英語專業(yè)開設“國際商務方案策劃與項目培養(yǎng)”“數(shù)據(jù)庫應用基礎”“高級語言程序設計(Python)”等課程,豐富學生計算機、大數(shù)據(jù)分析等現(xiàn)代化技術的知識儲備,讓學生將理論知識運用到商務項目和社會實踐中,培養(yǎng)學生的語言運用能力、商務實踐能力、自主學習能力和創(chuàng)新能力,極大地激發(fā)了學生創(chuàng)新創(chuàng)業(yè)的興趣。
1.開設“國際商務方案策劃與項目培養(yǎng)”課程
商務英語專業(yè)開設了“國際商務方案策劃與項目培養(yǎng)”實踐課程。利用三周的集中實踐,學生能將課堂上學到的理論知識運用于具體的社會實踐中,并在實踐中得到升華。相較于以往的傳統(tǒng)的課堂教學模式,這種實踐教學和學科競賽相結合的教育模式使空洞的理論知識變得更加詳細具體,更加易于理解和消化吸收。這在很大程度上也激發(fā)了學生學習的興趣與熱情[13]。
2.開設“數(shù)據(jù)庫應用基礎”“高級語言程序設計(Python)”課程
商務英語專業(yè)開設了數(shù)據(jù)和語言類計算機課程。這類課程的開設不但豐富了學生的計算機、大數(shù)據(jù)分析等現(xiàn)代化技術的知識儲備,為外語數(shù)據(jù)標注打下堅實的基礎,同時在很大程度上也極大地激發(fā)了學生創(chuàng)新創(chuàng)業(yè)的興趣。實踐證明,此類課程的開設對培養(yǎng)大學生創(chuàng)新創(chuàng)業(yè)能力起到了顯著的作用。
3.開設“專業(yè)認知實習”課程
為了更好地讓學生了解學科和專業(yè)的知識,商務英語專業(yè)開設了“專業(yè)認知實習”課程,讓學生一進校門就能夠了解商務英語契合的職業(yè)特點、行業(yè)規(guī)則和工作流程,有助于學生充分進行職業(yè)規(guī)劃,也與“畢業(yè)實習”課程形成了良好的呼應。重視實踐教學體系的構建,專門開辟出實踐課程的模塊,切實提高了學生的實踐能力和綜合素養(yǎng)。
校企合作是培養(yǎng)商務英語專業(yè)應用型外語數(shù)據(jù)標注人才的必由之路。“產(chǎn)學研”合作不僅可以促進高??蒲谐晒霓D換,還可以提高學生大數(shù)據(jù)審計實踐能力和企業(yè)的科學技術水平。軟件公司或者企業(yè)并不熟悉高校商務英語專業(yè)的實踐特性及規(guī)律,學生在學校接觸不到企業(yè)實際工作中多源異構的海量數(shù)據(jù),同時高校商務英語教師在企業(yè)實踐及相關技術方面有所不足,因此,采用企業(yè)、數(shù)據(jù)公司、學生及高校教師合作進行“產(chǎn)學研”的合作模式對商務英語專業(yè)外語數(shù)據(jù)標注人才培養(yǎng)是一種新的嘗試及探索。
鄭州經(jīng)貿(mào)學院商務英語專業(yè)師生與校外數(shù)標企業(yè)深入合作,引企業(yè)入校,建立數(shù)據(jù)實驗室。在此基礎上,由專職教師和企業(yè)導師共同指導學生成立了數(shù)據(jù)標注工作室,主營外語類、圖像類、自然語言處理類數(shù)據(jù)標注項目,為字節(jié)跳動、阿里巴巴、文思海輝及好未來等企業(yè)提供了優(yōu)質的基礎數(shù)據(jù)服務,積累了豐富的數(shù)據(jù)采集和標注經(jīng)驗。在2020—2022年疫情防控至復工期間,工作室線上數(shù)據(jù)標注員達到200人,來自河南及河北、陜西、湖南、廣州、四川等各大高校的商務英語、英語、日語、俄語、通信、生物制藥等專業(yè)在讀大學生共同完成了跨境電商、教育教學、醫(yī)療、無人駕駛和安防等多種外語標注任務。培養(yǎng)商務英語專業(yè)應用型人才必須走產(chǎn)學研結合的路徑,這也是社會經(jīng)濟需求的體現(xiàn),既支持了地方產(chǎn)業(yè)的發(fā)展,同時也增強了自身的科技創(chuàng)新能力,培養(yǎng)了外語數(shù)據(jù)標注產(chǎn)業(yè)適需適用的商務英語專業(yè)應用型人才[12]。
外語數(shù)據(jù)標注人才培養(yǎng)要以培養(yǎng)語言能力為核心,提高數(shù)字化信息素養(yǎng)和量化思維能力,以寬口徑的商務知識為依托,以產(chǎn)出為導向,以培養(yǎng)思辨能力和創(chuàng)新能力為根本,以提高學生的綜合素質為最終目標。在《河南省人民政府辦公廳關于深化高等學校創(chuàng)新創(chuàng)業(yè)教育改革的實施意見》等政策的支持下,在“以賽促學,以賽促教,以賽創(chuàng)新人才”理念的引領下,鄭州經(jīng)貿(mào)學院積極實施“人才強校”戰(zhàn)略,應用型人才培養(yǎng)質量不斷提高。學生在全球品牌策劃大賽、全國電子設計競賽、全國數(shù)學建模大賽、全國“挑戰(zhàn)杯”大賽等雙創(chuàng)比賽中屢創(chuàng)佳績,反哺高質量人才的培養(yǎng),形成良好的循環(huán)。
隨著外語應用場景的不斷擴展,數(shù)據(jù)標注行業(yè)對外語專業(yè)化人才需求存在巨大的缺口。構思“一體多翼”的行業(yè)高質量發(fā)展路徑,制定科學的外語數(shù)據(jù)標注規(guī)范,以提高數(shù)據(jù)標注質量、增加技術服務手段、拓寬數(shù)據(jù)服務平臺為主體,以定制個性化產(chǎn)品與升級服務,以“產(chǎn)學研”為契機、三位一體的“復合型+產(chǎn)業(yè)型+專業(yè)型”數(shù)據(jù)標注人才培養(yǎng)“豫鷹”計劃、培育高校和產(chǎn)業(yè)聯(lián)盟鏈數(shù)據(jù)集、以“AI服務AI”等為支撐,能夠實現(xiàn)河南省數(shù)據(jù)標注行業(yè)人才培養(yǎng)的高質量發(fā)展。