□
內容提要 本文結合現階段互聯網平臺的內容風控實踐,分析了行業面臨的難點痛點,提出未來需政府、企業、高校等相關主體形成合力,共同優化行業管理體系與運行機制,強化信息共享,重視人才培養,促進互聯網平臺企業在內容建設方面優化發展。
2019年12月,國家網信辦公布了《網絡信息內容生態治理規定》,通過八章四十二條,對網絡信息內容生產者、網絡信息內容服務平臺、網絡信息內容服務使用者及網絡行業組織的主體責任進行了非常明確、細致的界定,這標志著國家對互聯網企業內容風險防控責任擔當的要求達到了前所未有的高度。各互聯網平臺也意識到內容安全在企業發展中的重要戰略地位,開始更新信息審核技術、搭建內容質量團隊;無論是監管層面還是平臺實踐層面,網絡生態建設已經逐步探索出路徑。
近年來,各大互聯網平臺均逐步開始搭建內容安全團隊。管理層面,內容安全由總編室等內容機構負責,以產品為單位下設安全管理組織,層層把關。執行層面,頭部平臺均自建審核團隊,并不斷擴充一線審核隊伍,部分平臺審核人員規模已達到數千人;中小型平臺主要使用第三方團隊審核服務,與自建質檢團隊相配合,保障內容安全。
除日常審核工作外,各平臺也配合主管部門不定期開展專項整治活動,成立專項領導小組,小組成員由公司內容安全中心、運營中心、產品部、技術中心、公共事務部等部門主要負責人組成,協調各部門在專項執行方面的工作,確保領導小組的要求和舉措能夠傳達到相關各部門并得到貫徹執行。具體執行層面,通過質檢回查和專班團隊為班底搭建“專項清查小組”,成員囊括舉報對接、客戶服務、產品支持等部門,支持專項工作開展。
《網絡信息內容生態治理規定》實施以來,互聯網平臺的內容安全治理重心從單一安全保障向整體生態營造轉移。拓寬內容審核標準邊界、拓展審核操作維度、健全推薦算法機制、應用青少年守護模式、全面巡查廣告內容、明確用戶協議、逐步建立賬號信用管理制度、完善舉報流程,建立生態安全矩陣。
安全審核層面,為新增發布信息筑起兩道安全甄別防線。以內容三審團隊為主體,運營團隊為輔助,通過機器加人工的“人機結合”方式,建立起內外部常規巡查、專項復查、機器篩查的自查模式,為內容安全建設保駕護航。在此基礎上,著力通過敏感詞庫迭代補充,提升審核后臺的自我攔截能力;采取AI違規模型對樣本強化學習,增強對平臺內容的技術排查能力,及時排查與處置高相似度的內容;內容安全所關注的對象也不再局限于內容本身,細化到內容標題、封面、上傳者、價值導向、面向群體等各個環節。
生態建設層面,從傳統層面對黃、賭、毒等涉底線層面的關注擴大到對泛化內容的關注,如聚焦政治民生的“清風行動”專項清理,又如聚焦未成年人暑期網絡環境的“清朗行動”專項清理,確保網絡環境綠色健康。同時,完善投訴渠道,鼓勵用戶舉報不良信息,并與客服、產品支持團隊聯動,做好用戶舉報、申訴的復核和處置工作。處置結果除有害內容全面下架外,完善賬號封禁處置體系,規范和約束用戶行為。
此外,對重點內容、重點領域的關注逐步加強。為確保頁面生態健康,互聯網平臺也著力提升推薦機制,加強對高曝光位內容的管控。
在榜單、push區、搜索框推薦等重要位置上,采取審核+運營雙重多道復驗的管理模式,安排輿情團隊針對站內標題進行不斷監測,保持7×24小時巡查。輿情團隊與一線團隊相互交叉,及時快速發現重點問題,緊盯重點平臺和高危賬號發布的內容,及時跟進本平臺情況,防止同樣的高危內容在本平臺上繼續傳播。
傳統安全審查工作的手段和重心在于事后“滅火”,較為滯后、被動。近年來,通過輿情監測和輿情分析前置布控,提前預防成為內容安全防控的重要手段之一。建立輿情團隊,采取全天不間斷追蹤梳理分析網絡上關聯信息,對潛在風險內容,加強相關信息輿情傳播、發酵特性研究,深挖細節、精準分析、分析結果成為動態調整審核策略與執行方案的重要依據。
由于內容風控工作專業性強,對從業者知識儲備、意識形態敏感度等能力要求高;且需根據實時監管動向和輿情熱點更新研判尺度和研判策略,各平臺均不斷完善風控人員培訓體系和培訓課程,將新員工上崗培訓、常態化提升培訓、重大事件時間節點培訓結合,以平臺日常風控工作積淀的豐富案例為基礎,提升培訓內容的針對性和實操性,做到活學活用,即學即用,通過持續的班前培訓和專項輪訓,不斷彌補短板,提升全員業務能力。
經過多年的實踐,目前各平臺都已經結合各自產品特點建立了一套較為行之有效的內容安全保障機制和措施,但也面臨共性的難點。一方面,需審核的存量、增量內容體量大,機器智能審核能力有限,需要投入大量人工成本、管理成本。另一方面,網絡語言形態和視聽文本表達日新月異,新問題、新情況層出不窮;國際宏觀環境錯綜復雜,每天都面臨各式各樣文字、圖片、視頻形式有害信息的倒灌。平臺屢屢被動,應對不暇。
關鍵詞庫作為文本過濾、識別的主要手段,近年來遭遇越來越嚴重的變異對抗,尤其經過多年經驗,用戶已經普遍熟悉和了解企業關鍵詞過濾和審核邏輯,有意使用各種隱晦、暗諷等變體形式繞過風控策略。出現各類文字變體,圖片也出現借動漫、動物、典故等各類隱秘圖片映射的有害信息,技術識別難度極大。為保證有害信息召回,平臺不得不投入持續擴大審核人力投入,成本也逐年攀升。
網絡實名制執行以來,基于手機號、驗證碼等注冊登錄成為許多網絡平臺的主要“通行證”,為了“迎合”市場的需求,一些基于所謂“打碼平臺”“貓池”“卡商”的黑色產品鏈日益猖獗,形成了龐大的賬號生產、盜取、交易等產業鏈路,為惡意用戶源源不斷提供成本低廉的垃圾賬號,持續輸出違法有害信息,而企業封禁賬號速度很難追趕上新增速度。同時,此類賬號也難以通過實名制定位,追查難度大,亟待監管部門加大行業治理,尤其是針對電信服務的源頭治理。
業內專家認為,內容風控產業具有“人才密集型”特質。目前,人工智能對內容的辨別還停留在關鍵詞命中等較為淺層的程度,百分之八十以上的內容風險依然依賴于人工研判,因此需要大量優質的風控專業人員,要求他們必須站在有益于社會的高度去理解內容生態,并擁有豐富、全面的歷史、文化、語言、經濟、軍事等知識儲備,才能自如應對各類違規內容及其形態變形。而目前從業人員業務能力普遍不能滿足上述要求,尤其是初入行的從業者;市場人才儲備也無法滿足平臺大體量的人才需求。且由于內容安全團隊往往人員流動性大,企業投入高成本培訓成熟的員工流失率很高。
面對亟需解決的難點、痛點,近日,中共中央辦公廳、國務院辦公廳印發《關于加快推進媒體深度融合發展的意見》,明確堅持正能量是總要求、管得住是硬道理、用得好是真本事。未來需政府、企業、高校等相關主體形成合力,共同優化行業管理體系與運行機制,強化信息共享,重視人才培養,促進行業良性向好發展。

目前,各平臺內容安全工作還處于各自為戰的狀態,審核策略、審核機制、不良樣本、有害案例等均被列入企業機密,對行業同好諱莫如深。導致許多相似性、重復性的工作內容占用了各平臺寶貴資源,也無法在交流和溝通中達成更多行業共識。因此,建議建立黑名單共享、不良樣本共享機制等,促進全網管理統一尺度和標準的形成。例如,引導行業建立人工智能模型算法訓練所需的公共數據集,在加強隱私保護等基礎上,通過免費開放和數據交易等方式,為行業應用提供關鍵數據資源。
有害內容題量大、種類多樣,對平臺審核策略、審核邏輯、技術手段和審核員個人能力都是巨大挑戰。因此,可對內容實行分級分類管理,不同等級、不同種類的內容采取相對應的審核方式,實現內容審核精細化管理。如,建立白名單制度,對來源規范的PGC內容采取不審或快速審核手段;對軍事類、歷史類、時政類等研判難度大的內容,分別建立細分領域專業審核團隊,由系統分配給在相應領域經驗豐富、知識儲備量大的審核員做研判處置。
目前我們普遍看到,各平臺的一線審核人員學歷低、底子薄、工資低,從而影響整體風控成效。市場對審核人員的需求與日俱增,對從業者專業能力的要求也不斷攀升。面對巨大人才缺口,政府、企業、高校應當共同統籌開展職業資格培訓,培養從業者思想站位與格局、基礎審核技巧、政策轉化為實操尺度的能力,及運營風控、輿情風控等多方面能力,提升從業者職業素養,幫助企業培養高質量風控人才。
目前,人工智能技術在內容審核方面仍然力有不逮,尤其在一些復雜場景、模糊地帶,易出現漏判、錯判或誤傷。未來應當加大對審核及監測側的技術研發投入,不斷迭代強化自主內容安全技術研發部署,進一步強化網站內容安全技術體系建設。設置典型文字、圖片樣本信息庫,通過提高機器審核環節內容的召回率和命中率,持續增強人機協同策略,形成1+1>2的效果。