王元元
主動刪除的疑似侵權鏈接中,97%一上線即被封殺;24萬個淘寶疑似侵權店鋪被關;協助司法機關抓捕制假售假涉案人員1606名,搗毀窩點1328個;全平臺的知識產權侵權投訴量下降了42%。
這是2017年阿里巴巴集團在知識產權保護方面交出的成績單。
“假貨及侵權處罰時間縮短、權利人投訴量下降、網絡售假問題得到顯著遏制。”阿里巴巴集團首席平臺治理官鄭俊芳在接受《瞭望東方周刊》采訪時說。

“借助數據技術,阿里巴巴既能對疑似假貨或者侵權鏈接、售假人員及團伙進行識別,又能在售假者開店、商品發布等環節實施攔截,還能對每天發布在平臺上的大量商品作風險判定并由此作出相應處理。”鄭俊芳告訴本刊記者。
而這背后是數年來阿里巴巴在技術方面的持續投入。
“我剛來的時候,負責打假技術研發的工程師還比較少,現在這個團隊已有數百人。”阿里巴巴集團(以下簡稱阿里巴巴)平臺治理部總監徐駿對《瞭望東方周刊》說。
“眾所周知,阿里巴巴是一家技術驅動型公司,一直都非常注重技術研發,我們在打假中應用的很多技術就是來源于本身的技術積累,并非獨創。”鄭俊芳告訴本刊記者,最具代表性的就是圖像識別技術。
起初,圖像識別技術多用在“同款聚合”功能上,即通過識別圖片信息的相似度為用戶推薦同類型的消費商品,定制個性化的消費頁面。
但一些售假者卻通過盜用品牌商的圖片給自己的假貨作宣傳,吸引消費者。于是,阿里巴巴平臺治理部的技術團隊開始針對打假的特定場景對原有的圖像識別技術進行改造,讓后者具備辨別真假的能力。
從2013年起,阿里巴巴逐步建立起了全球最專業的圖片侵權假貨識別系統,通過檢測圖片中的局部logo,來識別圖片中商品的品牌,進而判斷該商品是否為假貨,識別能力甚至超過了國外同類圖片偵測軟件Google Goggles。
然而,售假者為了躲避平臺的偵測,不再在商品描述中植入品牌信息,而把一些違法信息或聯系方式在圖片上進行標注。
如此一來,僅靠識別logo的技術就不夠了。技術團隊的解決方案是,引入OCR光學字符識別技術,進一步擴大圖像識別涵蓋的范圍。
OCR的最大特點是能夠實時讀取圖片中包含的文字信息,每秒可掃描2354萬多個圖片文字,相當于501本《康熙字典》的字量,且能保證高達97.6%的識別準確率。
“即便售假者故意將圖片中的文字模糊化處理,OCR技術也能精準識別。”徐駿告訴本刊記者。
目前OCR已廣泛應用到打假中,而其背后的圖像識別技術更因每日識別約6億張商品圖片被視為阿里巴巴的“火眼金睛”。
不過,認出圖片中的文字只是第一步,還需讓后臺的監控系統知道這些文字所代表的含義,以此來判斷產品是否真的侵權,這便催生了語義識別算法。語義識別算法是在OCR識別文字的基礎之上,對文字進行語法和詞法分析,提取出語義要點,讀出文字代表的真正含義。
以手機為例,一些手機經銷商會刻意在圖片中打出“運行速度堪比蘋果”“待機時間遠超蘋果”等字樣吸引用戶,語義識別算法通過復雜的語言比對,能辨別出這些詞句并不代表產品造假,只是一種宣傳用語。
“這就起到了過濾作用,排除了無關商品的造假嫌疑,極大地降低了系統的誤判率,使我們能夠更為精準地找到并攔截售假者。”徐駿說。
但在阿里巴巴平臺治理部資深總監錢磊看來,這還遠遠不夠,“無論圖像識別還是語義識別,針對的僅僅是平臺商品的某一特征,阿里巴巴需要在更廣、更深的緯度實現對售假店鋪以及假貨的全面管控。”

因此,在圖像識別技術和語義識別算法的基礎上,建立一個類似人腦運作模式的高度智能化“商品大腦”成為技術團隊的最終選擇。在錢磊的構想中,這個“商品大腦”會囊括多種單項技術、覆蓋盡可能豐富的產品信息,作出自主判斷。
“人類大腦是基于長期的知識積累形成經驗和認知后,據此對不同事物作出不同的反應。‘商品大腦也是如此,首先要具備豐富的知識儲備,才能對商品進行真假識別。”錢磊告訴《瞭望東方周刊》。
自成立起,阿里巴巴便通過后臺復雜、嚴密的管理系統掌握了店鋪和商品的信息,經過18年的沉淀,已形成了體量龐大的商品數據庫。
即便如此,“商品大腦”要準確記住數以億計的繁雜信息也并非易事。
阿里巴巴找到的突破口是分類記憶——先讓機器掌握結構化的知識點,如商品的類目、條碼、品牌、價格等,然后再嘗試補充用戶的使用評價、社交媒體的評論等非結構化信息。
“商品大腦”還需記憶商品的關聯信息。比如LV,“商品大腦”在知道正確的商品名稱外,還要牢記售假者慣用的“綠牌”“驢牌”等品牌名稱的同音詞或同義詞。
“如果‘商品大腦只記憶了單一的商品信息是很難識破這種騙術的,必須掌握更多的關聯信息才能作出正確判斷。”徐駿說,單個知識點只有相互聯系起來才能為商品的真假判別提供更大借鑒意義。
這樣一來,“商品大腦”便能由淺入深,更為快速、高效地掌握盡可能全面的商品信息,并且具備一定的學習能力,源源不斷地吸收新知識,保證不被售假者超越。
目前阿里巴巴“商品大腦”內容的豐富度已達到百萬億條實體信息加上百萬億條關聯信息。這些多維度的產品信息搭配上圖像識別、語義識別等前端科技,“商品大腦”便可像人腦一樣自動對阿里巴巴平臺上近20億件商品進行全天候、無死角的掃描,一旦發現售假就會即時對店鋪作出關店、下架產品等處理。
“‘商品大腦構筑了一面強大的防護網,讓那些售假者進入不了阿里巴巴的平臺,只要露面就會被一網打盡。”錢磊說。
“其實,圖片識別、語義識別乃至于‘商品大腦都只代表了科技打假的一部分,并非全部。”錢磊說,阿里巴巴每年都要投入數百名工程師,數億元資金用于打假技術的研發,目前已構建了多種技術手段相結合的打假技術體系。
這個體系除了上述三種打假“黑科技”外,還包括生物實人認證、政企數據協同平臺、大數據抽檢模型等,管控范圍覆蓋商品上架、售賣、下架的全過程,可做到實時掃描每一件新發布的商品。
嚴密的防控讓品牌商們松了一口氣。康寶萊(中國)保健品有限公司合規部高級總監舒亞杰告訴《瞭望東方周刊》,康寶萊在阿里巴巴的幫助下,借助其打假科技,僅用一個月便完成了兩個省的打假行動,協助警方抓捕了26人。
對身處打假第一線的警務人員來說,阿里巴巴打假技術帶來的影響更大。
“以往警方收集制假售假線索只能一條條收集,耗時費力,現在一個月之內,通過技術研判就可批量產出幾百條線索,還能對涉假行業的網店實行數據溯源。” 浙江省公安廳經偵總隊知識產權保護副支隊長陳競凱對本刊記者說。
不過,無論徐駿還是錢磊都坦承,技術打假并非萬無一失,也存在些許誤差,“技術手段多通過大量的數據對比來找出并攔截假貨,但對比結果不可能保證100%準確。”
阿里巴巴為此在技術后端設計了二次審核。對那些疑似售假的店鋪,打假團隊會立刻進行更為細致的審查,接受賣家的申述,如果審查后發現店鋪并未涉假,便會解除其店鋪屏蔽。
“我們的原則是不放過任何一個售假的店鋪,也不冤枉任何一個守法的店鋪。”徐駿說,這就要求阿里巴巴必須根據自身掌握的售假信息對打假技術進行動態調整。
實際上,阿里巴巴對技術的調整時刻都在進行,不僅要打磨適用于不同場景的通用技術,還要集合執法機關的研判知識和消費者的反饋,深耕專有打假場景,作特有技術的優化。
據了解,阿里巴巴未來會將資源投入到更具前瞻性的領域,例如構建假貨風險預警系統,提前預知哪些品牌、商品會被假冒,然后制定相應的攔截策略。
“阿里巴巴在打假上的終極目標是無假可打,這就代表著打假科技的演進也將相伴而行,直到假貨無跡可尋。”鄭俊芳表示。