淺析人工智能在數字出版產品審核中亟待解決的問題

2021-09-10 07:22:44張爍

科學與生活 2021年14期

張爍

人工智能審核尚處在探索和嘗試之中，有些功能還不完全智能。目前，人工智能對數字出版內容的審核仍存在亟待解決的地方，是“文圖音視”形態領域內的通病。2017年4月，美國《Nature》雜志發表的一項研究成果表明，智能算法的原理是對人類所書寫的文本內容進行分析處理和深度學習，那自然就會帶有人類的習慣，難免會像人類那樣存在帶有偏見的刻板印象[1]，因而算法就會產生一些歧視、錯誤等問題，比如“較高的誤報率和漏檢率”。由于一些詞語存在多語義的情況，一句話相鄰詞語之間的鏈接容易造成誤報，以及不法分子還可以通過一些文字變異手段輕松繞開關鍵詞匹配。

1.誤報誤傷現象時有發生，應減少算法歧視

目前市場上有多種計算機校對軟件，其中包括模式較為簡單的校對模塊，更有功能更加強大的專業校對軟件。由于計算機智能審核的算法是基于對數據庫的深度學習，那么它的學習樣本必然是海量龐大的，為了盡最大程度用上所學，智能審核的算法會萬分“謹慎”，有著較高的靈敏度就會導致誤傷一些正確內容。

案例一：除去文字誤傷，圖片內容被誤傷更為頻繁。2015 年，谷歌研究并發布了一款自動圖像標記軟件，用以識別分類和審核，在識別一對黑人夫婦的圖像時，由于膚色與“黑猩猩”特征相似，將其標記為“黑猩猩”，并將黑人照片自動上傳[2]，其實，許多其他公司研發的自動標記系統也都存在諸如此類的問題。這些程序形成的“低級錯誤”雖成為人們的玩笑談資，但也警醒著人們，在實際應用中這種技術不成熟所導致的“低級錯誤”可能會形成更為嚴重的歧視結果。[3]

案例二：YouTube用戶Jamison Go收到了一份平臺的違規處理通知，平臺方直接刪除了他發布的機器人比賽格斗視頻，算法檢測到該視頻涉及對虐待動物或迫使動物打斗。而視頻中的真實情況卻是機器人喬普正在和另一個機器人格斗。而實際上YouTube本身并沒有關于禁止上傳機器人格斗視頻的規定，此番操作或許是因為算法誤將該視頻標注了虐待動物的詞條，經審核后系統自動將其刪除。在接到投訴后，YouTube人工團隊重新進行了人工檢驗并恢復了原先被誤刪的視頻。因此以后在類似審核案件中，應該由人工智能審核進行初審，有必要的情況下由人工進行再次篩查。

2.對于審核遺漏，改善算法技術

正所謂“道高一尺魔高一丈”，用戶在熟悉了平臺的智能審核原理后，有些圖謀不軌的用戶會借此打擦邊球，但是阿里云計算公司在世界杯期間利用自然語言處理技術能夠智能地分析出文字的語言情感，防止文本變異而產生的審核遺漏。

中華文化歷史悠久，漢語的發展歷程源遠流長、博大精深，但是對古籍文獻的審核是目前智能校對軟件需要一同努力攻克的難題，有時還是需要專業的人工審核介入。

3.智能審核應注重社會效益，盡快建立人工智能算法審查機制

人工智能的飛速發展必然帶來大量法律法規的立、改、廢，甚至會引起倫理、道德層面的一些價值沖突。[4]在美國，17歲少女遭到殘忍殺害的血腥照片瘋傳網絡，部分網友表示看后產生惡心、心理陰影等不良反應，Facebook平臺的人工智能審核力度遭到網友的強烈質疑。此次不良影響究竟是人工智能審核系統的失靈遺漏還是為了熱度而故意保留，暫時無法考證，因而更加需要建立人工智能算法審查機制，在高質量完成審核工作的同時也要注重社會影響保障社會效益。

正如尼爾·波茲曼在《娛樂至死》中評價電視時提出的“每一種思想的新工具的誕生都會達到某種平衡，有得必有失，雖然這種平衡并不是絕對的;我們在或毀或譽時要十分小心，因為未來的結果往往是出人意料的。”[5]

也就是說如果人工智能的審核過濾機制原本是為用戶屏蔽掉一些不良的極端信息，從而營造清爽的網絡環境，但如果把自殺、他殺等殘暴行為的發布內容或網絡求助信息通過算法屏蔽掉后，平臺方未作出后續行為從而掩蓋了事實，妨礙案件的發現及辦案，就與審核的根本目的大相徑庭了。由于缺乏有效的自動化技術來識別這些內容，所有這些不可信和不恰當的內容都需要依賴于專業人員的知識儲備、個人評判來識別，并核對事件的關注度和可信度從而甄別定奪是否告知于警方。[6]因此在人工智能審核惡意內容的技術尚不完善的前提下，建議人工介入處理。人工智能應該做到互聯互通，當標記出有自殺等有危險性的想法時，應該幫忙聯系急救人員。

2020年3月起《網絡信息內容生態治理規定》開始實行，筆者認為人工智能審核技術很適合對網絡暴力等網絡不良行為進行追蹤監測，以及加強對可疑用戶的審核，從內容生產者和傳播者的角度控制劣質內容的產生及傳播。盡快出臺算法的倫理道德規范，從而劃分算法倫理道德法律的界限。

4.建議將區塊鏈技術應用到智能審核中

區塊鏈與人工智能的關系就好比計算機和互聯網：前者是數據的存儲方式，后者則是由數據產生的應用。區塊鏈的真實就意味著更多優質訓練數據，在應用人工智能技術的同時，用區塊鏈保證流程的透明和靈活;人工智能在算法上的突破，也能幫助區塊鏈提升數據的傳輸效率。數字出版產品的版權審核，如果將區塊鏈技術與人工智能結合，將促進“版權審核”更加智能化、規范化。

5.探尋機器和人的新關系

自從人工智能進入大眾視野以來，“機器是否會取代人類？人工智能給人員就業帶來何種壓力”的言論甚囂塵上。但是在出版界，機器和人的關系一直都是人機協作、機器輔佐人工。在出版的審校工作中，編輯人員雖不如機器那般依托于龐大的數據庫而擁有海量的知識儲備，甚至工作效率遠不及智能審核，但是在人工智能的協助下，編輯的功能正在逐步轉變——編輯的工作將會向掌控全局、調整軟件參數、最終審查等工作上發展。[7]同時，編輯不能產生惰性而過于信賴機器，仍然要發揮好把關人的作用。編輯要緊密觀察機器的動態，及時對智能審核系統進行查漏補缺，完善其深度學習的數據庫，讓審核更加智能高效。

結語

在這個萬物皆可AI的時代，人工智能的確對我們的工作起到了提質增效的作用，無論它技術進步得多么迅速和完善，人工智能審核都不能完全取代人工，智能和人工之間的關系永遠都是智能服務于人工，機器輔佐人類，減輕人類的工作量。我們不能過于依賴它，否則人們便成了傀儡，要做AI的主人而不是奴隸。善于將AI靈活運用，使其成為我們的工具，探索出一條人機協作的高效之路。