■楊 霓
(福州工商學院,福建 福州 350715)
近年來,跨境電商行業迅猛發展,其中產品文本作為產品相關信息的主要文字媒介,對于“一帶一路”發展,中國產品順利“出?!本哂信e足輕重的作用。在產品詳情頁中,翻譯精良的產品頁文本有助于順利傳達產品信息、建立品牌形象,提升買家購物意愿,進而推動產品轉化率的提升。
而值得注意的是,目前國內外關于跨境電商產品文本語料庫的構建及翻譯研究遠遠滯后于跨境電商行業的發展,該領域的研究尚處于起步階段,且使用語料庫方式進行相關的研究并不多,已知Liu Jing[1]主持研制了跨境電商運營英語語料庫用于探討英語專業教材的編制,但其研究所建立的語料庫僅僅為目的語原創產品文本單語語料庫,更多用于教材的編寫上,并未將研究焦點聚焦于產品文本翻譯研究;楊娟娟[2]通過收集阿里巴巴裙子類目產品標題,自建跨境電商日語裙子類目產品標題語料庫,但其語料收集規模較小,同時結論未見定量數據的支撐。筆者的研究旨在能夠探索跨境電商類比語料庫建設的可行方案,建立一個相較于產品標題,語料收集范圍更為擴大的中國賣家產品翻譯文本與外國賣家產品原創文本的英語類比語料庫,并通過嘗試自建亞馬遜路跑鞋類目類比語料庫,探究亞馬遜跨境電商路跑鞋類目翻譯詞匯在詞匯難度、變化程度、具體運用上是否相較于原創文本具有較大的差異?在下文中將從總體詞匯和具體詞匯兩個層面進行假設與量化論證研究。
在語料庫的設計之初,主要針對了語料來源的跨境平臺、語料的類目選擇、語料的產品文本來源進行探討??缇畴娚唐脚_眾多,各平臺的產品詳情頁面組合不盡相同,為了初步探討跨境電商產品文本語料庫的建立,本研究基于亞馬遜平臺在跨境電商行業的知名度、專業度、文案的詳盡度,選取了此平臺美國站作為案例平臺。而亞馬遜平臺產品種類繁多,各類目中每個大類目中還有數個子類目,不同類目的產品文本若是統一歸到一個語料庫中進行對比,對于具體語言詞匯的研究很難達成效果。在參考亞馬遜平臺大類目的劃分后,我主要設計跨境電商產品文本語料庫由以下幾個大類目子語料庫組成:Clothing,Shoes,Jewelry & Watches;Books;Movies,Music & Games;Electronics;Computers;Smart Home;Home, Garden & Tools;Pet Supplies;Food & Grocery;Beauty & Health;Toys, Kids & Baby;Handmade;Sports;Outdoors;Automotive&Industrial;Industrial and Scientific跨境電商產品詳情頁中分設不同的文本功能區,以亞馬遜平臺為例,其產品詳情頁中分為以下幾塊功能區域:產品標題;短描述/五點描述;長描述;A+頁面文字部分。其中,短描述/五點描述的展示位于產品圖片右側,以五個大圓形項目符號為起始,不要求完整的句子,要求能突出產品的五個重要的特性。產品的A+頁面以圖文形式更加生動形象的展現產品內容,在提升產品轉化率中均扮演著重要的作用。故本研究認為語料庫的建設應以文本功能區的不同分設幾個子語料庫。
為了初步探討跨境電商語料庫建設的可行性,筆者選取所在省份跨境電商出口較多的路跑鞋品類為案例,同時,鞋類產品名稱在英文表達中具有復數性,性別屬性等特點,對于該類產品文本詞匯特征的研究還能夠有效類比到其他具有類似屬性的產品。本研究語料來自于亞 馬 遜 Clothing,Shoes,Jewelry&Watch〉Woman/Man〉Shoes〉Athletic〉Running〉Road Running 子類目,依據平臺中賣家公司地址來確定中外賣家身份,中國賣家主要來自福建?。ㄈ菖c莆田等地)、四川省、廣東省,外國賣家以美國賣家為準,收集數據如附表1 所示。

附表1 亞馬遜路跑鞋類目“中國賣家翻譯產品文本”與“美國賣家原創產品文本”語料收集情況
在語料收集過程中,基于本品類中國賣家數量的限制,無法收集到更多語料,造成在總體字符上無法形成對等。但本研究可比性是基于產品詳情頁條目數量而非字符數,故此角度符合語料可比性要求。
按照Baker[3]的解釋,簡化是指譯者在目標語文本中對源語文本的語言信息下意識地進行簡化處理的傾向。故筆者提出路跑鞋類目翻譯詞匯相較于原創英語詞匯是否具有“簡化”的特征?
為了獲知兩個語料庫的總體詞匯特征情況,在語料的選取上將標題、短描述、A+頁面文本各子語料庫相集合,對中外賣家整體的產品文本進行對比。通過WordSmith 軟件分別計算兩個語料庫的TTR、STTR(計算基數為1000)、平均詞長?!邦惙头仁呛饬空Z料用詞量的因素之一”[4]。從表1 中可知,由于同樣條目產品的形符類符值不大一致,故參照STTR 值,從表中可知,中國賣家翻譯文本STTR 值為37.01,小于外賣原創文本,由此可見,外國賣家原創產品文本用詞更加豐富,同時也能在某些程度證明中譯英翻譯文本詞匯具有“簡化”趨勢的假設。

表1 中國賣家產品翻譯文本與外國賣家產品原創文本總體詞匯特征情況
平均詞長是指特定文本中所有單詞的字母總數與型符總數的比值,詞長標準差表明單詞長度在平均詞長左右浮動的程度。以往的語料庫研究顯示,平均詞長是反映文本文體正式程度和用詞難度的重要指標之一[5]。從表中可知,兩個語料庫平均詞長相等,均為5,詞長標準差差距并不懸殊,考慮到兩語料規模和語料庫軟件精度的影響,故該數據可能無法證明文本翻譯“簡化”的假設。
詞匯密度同樣也是衡量文本詞匯難度的另一重要指標,通過使用ClAWS5 對文本進行詞性標注,并通過AntConc 軟件分別對實詞進行檢索,得出表2。

表2 中國賣家翻譯文本與外國賣家原創文本詞匯密度情況
從總體來看,翻譯文本詞匯密度略微高于英語原創文本,這與翻譯“簡化”假設不符。其中翻譯文本動詞使用密度明顯高于外賣原創文本,推測“翻譯文本在翻譯過程中受到漢語側重動詞結構,而英語側重名詞結構”[6]的影響。
“對目的語典型詞匯的研究可以深入了解源語和目的語之間的轉換規律和譯者所采用的翻譯策略”[7]。基于跨境電商產品文本的特點,覆蓋面較廣,語料類型豐富的語料庫無法進行有效分析,應該以各部分子語料為基礎,進行數據分析與探討,進而為各部分的語言翻譯提供參考。
1.產品標題主題詞分析
“語料庫對比中的主題詞指在兩語料庫中的頻數有顯著差異的詞。”[9]本研究通過在AntConc 軟件中以中賣標題子語料庫和美賣標題子語料庫互為參照語料庫和觀察語料庫的方式得出表3 和表4。

表3 外國賣家產品標題主題詞表

表4 中國賣家標題主題詞表
從表3 和表4 中可分析得出:內容表達上,中國賣家在產品標題的撰寫中趨于對產品的功能與特性進行描述,而美國賣家則更趨向于對產品的品牌和型號進行描寫。原因由于中國賣家是自有品牌,大部分品牌知名度不高且品牌內部路跑鞋并無系統的型號標識,故為了搜索流量,更偏向翻譯產品的特有功能、特性、使用場景,而在選取美國賣家語料時,所選語料均來自美國熱銷榜單,除產品名稱和性別外,相比于中國賣家標題,更多涉及到的是品牌與型號內容。
2.關于復數名詞類商品翻譯
語體風格上,從表3 中看到外國賣家標題主題詞中排名第一的是商品的單數名稱表述Shoe,從而提出假設:在表達鞋類品類詞時,翻譯詞匯是否與原創詞匯存在差異?筆者通過索引兩個語料庫中Shoe 和Shoes 的頻數得出表5。

表5 中國賣家標題與外國賣家標題子語料庫中鞋類名稱情況
注:外國賣家標題中有16 個shoes,均來自ASICS品牌,經調查,雖店鋪位置位于美國,但ASICS(亞瑟士)是日本一家跨國運動品牌公司,并非本土英語國家公司;另一個為HOKA ONE ONE 起源法國的公司。
分析表5 得出:對于英語日常生活中通常以復數描述的物品shoes,外國本土賣家偏向于從單個產品的角度去描述,而中國賣家在翻譯產品名稱時,受英語語法規則的的規訓而忽視了不同的文化視角,可以從數據看到,原創文本在描述產品名稱時,基本上偏向從雙數產品的角度去描述。
3.關于商品同義詞的表述
通過觀察表4 中國賣家排名第三主題詞sneaker,檢索得出表6。

表6 中國賣家標題與外國賣家標題子語料庫中鞋類同義詞sneaker 情況
在商品標題的翻譯中,考慮到顧客可能使用到的產品搜索關鍵詞能夠為產品帶來更多流量,進而提高轉化率家可能用到的搜索詞。在標題中運動鞋的替代叫法中,中國賣家普遍使用sneakers 來作為路跑鞋的替代產品名稱,sneaker 指得是日常穿著的便宜耐穿的鞋子,用法較為日常。而美國賣家則較少使用此詞語,一方面可能受語料來源均選自美國大牌運動鞋有關,另一方面也體現了美賣在路跑鞋產品名稱使用的正式化程度更高。
4.關于商品性別適用的表述
通過表7 外國賣家標題主題詞排名第二的“s”的觀察,通過使用AntConc 軟件的檢索與定位,發現“s”是用于表達產品男女適用性的應用,故可表明翻譯文本在路跑鞋男女適用性的詞匯表達上與原創文本存在差異。通過檢索可能使用到的產品男女適用性情況,得出表8,通過數據對比,發現英語原創文本表達路跑鞋產品適用性別特征中,極大程度都偏向于使用男女復數名詞加上's所有格形式來反映路跑鞋產品的性別所屬關系。其中,womens/mens 顯然為錯誤文字表達,值得注意的是,翻譯文本有近三分之一頻率出現此類錯誤表達,數量之多,不容小覷。而看到英語原創文本標題中也出現少數類似錯誤,經查發現出現此類錯誤2 處來自品牌名為HOKA ONE ONE 的運動鞋品牌,該公司雖然總部設立于美國,但起源于法國的一家運動鞋設計與銷售企業。另一處可能為標題編輯錯誤;另外根據表4 發現外國賣家主題詞中排序10 中出現Neutral(中性)一詞,經檢索發現均來自美國本土品牌Brooks,除了反映品牌的產品線之外,也能從側面反映美國文化中去性別差異化的一面。

表7 中國賣家標題與外國賣家標題中男女所有格情況

表8 翻譯標題語料庫中for 搭配情況
雖然產品標題描述并不屬于真正意義上的句子,但是標題除了具有搜索功能性外,還具有產品信息性,方便顧客直觀獲取商品信息。這就要求標題中詞語間的搭配在邏輯上需具有可讀性?!霸~簇指的是在語料文本中反復出現的兩詞或兩詞以上結構。”[9]根據表4 中排名13的虛詞for 提出假設:在翻譯文本中for 的使用與原創文本具有差異的原因可能是翻譯文本中使用for 用于適用性方面的表述。
以中國賣家翻譯主題詞中排名第13 的虛詞for 為中心詞,使用AntConc 軟件的Cluster 功能,詞簇長度為2到3 詞,最低頻數為2 次,搜索詞位置位于左邊,得出表9:
同樣的條件對于外國賣家標題并無得出任何數據,分析得出:相比外國賣家,中國賣家使用介詞for 來表達路跑鞋所適用的性別和用途,而非都將其放在產品詞前作為修飾語。
本文初步探討了跨境電商產品文本語料庫的設計與建設,通過自建小型路跑鞋類目類比語料庫,本研究探討了中國賣家翻譯文本與外國賣家原創文本的詞匯特征分析,并得出以下的詞匯特征結論。
在總體詞匯特征的數據中,兩個語料庫的標準類符型符比,可以在一定程度上證明翻譯“簡化”的假設。但是也得注意到從平均詞長的角度和詞匯密度的角度可能無法對假設做出有力的論證。在對翻譯“簡化”進行論證的同時,研究者需意識到翻譯文本的“多樣性”與“發展性”。
在具體詞匯的對比研究中,建議譯者在編譯帶有復數屬性的產品名稱時,遵照英語國家思維,從產品單數的角度進行翻譯描述;在表達產品的性別適用性時,使用復數名詞屬格的形式,即women's/men's 對產品名詞進行修飾,將更加符合英語國家的表達方式;在文本同義詞的選擇上,注意將產品與同類型、同定位的產品進行對照,防止同義詞中隱含的負面含義對銷售造成影響。
通過語料庫分析的方式探討翻譯文本和原創文本的使用情況,對于跨境電商行業從業者以及相關領域的教學以及教材編撰具有一定指導性作用??缇畴娚檀笮驼Z料庫的建設需要大量的人力、物力,且該行業中標題等內容會隨著市場的變化而發生改變,故語料庫在建設過程中應不斷更新調整。