王震
近年來,互聯網技術快速發展,信息傳播渠道不斷豐富。然而,“人人擁有麥克風”的時代,信息傳播門檻不斷降低,也為謠言、虛假新聞插上了翅膀。如何通過技術手段實現快速、準確地識別虛假信息,讓信息安全臻于“智”善?人民網“人機協作”內容風控提供了解決方案——在基礎的內容審核上進一步升級,初步實現“智能鑒謠”。在當下海量信息場景的實際需求下,單純依靠傳統的人工審核機制,已經難以實現識別謠言效率最大化。而將人工審核的經驗與人工智能、大數據相結合,打造“人機協作”的智能識謠平臺,應用到新聞生產、內容風控等實際場景,不僅能夠極大提高內容生產和審核的效率和準確性,更可以依托大數據深入研判分析,為內容企業提供決策參考、為平臺優化提供引導作用。
“新聞識謠”融入采編過程,生成“可信度指數”
由人民網、內容傳播認知國家重點實驗室、中科睿鑒合作研發的“睿鑒AI識謠”系統,將人機結合的創新內容風控技術用于輔助提升新聞生產、內容審核等場景的工作效率。基于多模態檢測、多層次表示、多角度判斷,該系統能夠自動發現可疑線索并進行認證,從而及時“揪出”可信度不高的信息。同時,基于數據驅動方法,系統能夠不斷挖掘出不同類別謠言的特性,實現對各種謠言的自動識別。
在“睿鑒AI識謠”系統中,打開一條新聞,能夠自動生成一份AI識別報告,內容包括新聞熱度、發展趨勢、用戶畫像等,同時基于大數據、AI分析生成新聞的可信度指數。“睿鑒AI識謠”僅需1分鐘就能對疑似謠言事件發出預警。目前,該系統已經應用在人民網的內容審核和新聞生產中。通過將“睿鑒AI識謠”智能接口融入采編后臺,編輯即可通過系統隨時獲知指定新聞的可信度指數。
2020年底,人民網-中科睿鑒新聞可信度識別支撐系統成功入選國家新聞出版署“中國報業深度融合發展創新案例”,其核心技術“開放環境下數字偽造內容檢測關鍵技術與服務平臺建設”獲得了2020年北京市科學技術進步獎一等獎。
此外,由人民日報社主管、人民網承建的內容傳播認知國家重點實驗室亦在內容風控領域取得研究進展。實驗室利用自然語言處理、大數據和人工智能技術,開展了“涉政論述知識圖譜”研究工作,參照《人民日報》的標準表述,開發完成智能審校輔助系統(暫名“智小助”),以滿足規范表述及內容審校的需求。該系統可對表述內容進行四個層級的規范情況提示,包括規范表述、過期表述、錯誤表述、成語和用戶自定義關鍵詞等,輔助內容創作者、審核人員進行內容創作和把關。
“風控大腦”概念落地,“人機協作”成內容風控首選
打擊網絡謠言是保障互聯網信息安全的重點,而其他隱藏于互聯網上的內容問題同樣不可忽視。在全媒體時代,無論是主流傳媒平臺還是商業平臺,無論是自媒體還是普通網友,人人都可發布信息,這就給了一些別有用心者可乘之機。不良信息潛藏在海量信息中侵蝕著輿論,同網絡謠言一樣,威脅著網絡安全、社會安全和國家意識形態安全。
如果說人工經驗決定了內容風控的高度,那么技術就決定了內容風控的效率。在這樣的背景下,“人機協作”模式成為內容風控的首選。它可以極大程度地減輕越到基層越難控的問題,更加適應海量內容和多變場景,適應有害內容組織性和對抗性增強的新特點、適應虛假內容隱蔽性增強的問題。
上述提到的“睿鑒AI識謠”系統,是人民網“人機協作型”內容風控系統的一部分。作為互聯網內容風控的“旗艦”,人民網十年來深耕內容風控業務,在全國擁有四大審核基地,團隊規模近千人。2019年,人民網首次提出人機協作型的“風控大腦”概念,旨在建設以人工智能技術為核心引擎,構建對海量全媒體數據的高通量感知、智能理解、深度挖掘、安全預警和全息展示的風控平臺。
“內容風控大腦”的技術建設已基本完成,并初步形成了面向全網的內容風控能力,可對海量互聯網內容如文本、圖片、音頻、視頻等進行智能采集、智能理解和深度挖掘,并已對外提供服務。“內容風控大腦”的互動、感知、推理等核心模塊均已投入使用。互動層實現了對境內外網站、APP、隱匿網絡的數據采集,以及網絡流量數據的實時還原;感知層完成了超過10000類的實體和場景識別算法;推理層采用多模態多標簽技術,實現了高語義級別的推理能力。同時,“內容風控大腦”的全部技術組件都已完成國產化平臺的移植,研發使用全國產化CPU、GPU的計算設備,實測性能超過國外主流產品。感知和推理算法在昇騰算力上實現了遠超業界主流水平的處理速度,為未來大規模應用提供了低成本計算基礎。
對外應用方面,“內容風控大腦”以SaaS等形式提供數據和計算服務,已經為政府、運營商提供從技術能力輸出到專項服務的多種支持,并已為數百家互聯網企業提供風控服務。接下來,將繼續增加境內外的覆蓋,逐步擴大“內容風控大腦”對社會平臺的數據開放和技術輸出,大規模拓展針對互聯網企業的智能風控服務,并以技術、培訓等形式為內容風控行業提供技術支撐。
探索“人工+AI”風控場景應用和跨領域融合
2020年,人社部增設“互聯網信息審核員”的新職業,教育部也將“互聯網內容風控”證書納入“1+X”證書制度試點。一系列的動作顯示,內容安全工作已成為維護網絡安全工作中一項長期而重要的任務,是各行各業必須重視的重點工作之一。人民網信息技術有限公司總經理辛瑞佳表示,接下來將依托國家重點實驗室和中科院自動化所的先進技術,不斷創新“風控大腦”研究成果,在以下兩個重點方面探索內容風控的新應用路徑。
一是探索面向商業平臺的內容巡查產品。隨著信息技術發展,互聯網內容體量呈現指數級增長。不少商業網站、公眾號、APP、小程序等存在信息無力管理的問題,許多違法、不良內容進入公眾視野,破壞網絡生態。在信息激增與人力資源有限的背景下,開發具有“小、快、靈”特色、能夠適合企業情況的風控系統至關重要。人民網“人機智能巡查”產品就是以此為場景的最新創新成果,包含日常內容巡查、節點預警、輿情分析、行業風險案例分析、綜合研判報告五大功能,通過“監督視角”巡查方式,實現“一鍵接入、整體管控、貼合業務、有效防范”的智能化內容風險控制。同時,針對審核、巡查等手段發現的問題,結合輿情、政策層面信息,依托專業分析能力,對問題進行全維度研判,形成內容安全診斷報告,幫助企業系統性了解內容風險,并助力實現運營與風控相平衡。
二是積極探索跨領域合作,助力基層治理。人民網同濟南網警試點打造了“楓橋式智慧社區平臺”。一方面,通過不斷深化以大數據智慧化應用為核心的新警務建設,及時發現社區網民的敏感信息、負面言論、案件事件和鄰里糾紛,進而化解矛盾;另一方面,開發適合該地特點的智能巡查系統,如同現實中的維護轄區內治安秩序的巡警一樣,智能巡查系統是維護網絡信息安全的重要技術手段,它可以模擬實現“多人瀏覽平臺內容”的場景,對移動應用APP和網站中的漏審內容、違法違規信息、惡意篡改行為、動態廣告等進行自動采集、內容比對和違規巡查,極大程度節省人力成本、擴大巡查范圍、降低內容安全風險。
互聯網內容風控是一個龐大的、不斷演進的管理體系。人民網為此做了具有開放性和包容性特征的前期探索性設計,未來將進一步在聯動地方、聯動媒體、聯動互聯網平臺方面加大力度,推進風控服務長效管理,探索出一套方便高效的合作模式,建立一個行之有效的互聯網安全共享共治機制。
作者單位 人民網經濟民生部
【編輯:陳琦】