周仕開
中國電信福建公司,福建福州,350001
互聯(lián)網(wǎng)不良信息治理并非一個新話題,多年來,社會各方在互聯(lián)網(wǎng)不良信息治理方面持續(xù)開展研究和探索。基礎(chǔ)電信運營商作為互聯(lián)網(wǎng)基礎(chǔ)設(shè)施建設(shè)的主力軍和互聯(lián)網(wǎng)應(yīng)用的主要推動力量,始終積極參與互聯(lián)網(wǎng)不良信息治理的研究與實踐。近年來,隨著治理環(huán)節(jié)的逐步前移,省級基礎(chǔ)電信運營商也開始逐步建設(shè)相關(guān)能力平臺,建立常態(tài)化治理運作機(jī)制[1]。
本文從省級基礎(chǔ)電信運營商視角,對互聯(lián)網(wǎng)不良信息治理的研究與實踐作了粗淺的探討,為社會各界提供參考。
基礎(chǔ)電信運營商持續(xù)推動我國互聯(lián)網(wǎng)基礎(chǔ)設(shè)施建設(shè),為互聯(lián)網(wǎng)大發(fā)展打下堅實基礎(chǔ)。“十三五”期間,我國建成了全球規(guī)模最大的信息通信網(wǎng)絡(luò),為互聯(lián)網(wǎng)產(chǎn)業(yè)騰飛和數(shù)字經(jīng)濟(jì)繁榮發(fā)展創(chuàng)造了條件。截至2021年12月,我國光纖接入用戶總數(shù)已達(dá)5.06億戶(占固定寬帶用戶的94.3%),移動電話用戶總數(shù)16.43億戶,其中4G移動電話用戶10.69億戶,5G移動電話用戶3.55億戶。
根據(jù)中國互聯(lián)網(wǎng)信息中心(CNNIC)發(fā)布的第49次《中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計報告》,截至2021年12月,我國網(wǎng)民規(guī)模達(dá)10.32億,較2020年12月增長4296萬,互聯(lián)網(wǎng)普及率達(dá)73.0%。有手機(jī)上網(wǎng)習(xí)慣的手機(jī)網(wǎng)民規(guī)模約為10.26億,在網(wǎng)民中的占比高達(dá)99.7%。互聯(lián)網(wǎng)已經(jīng)成為我國各行各業(yè)以及尋常百姓的主要信息交互媒介,在國民經(jīng)濟(jì)發(fā)展中起著不可或缺的重要作用。
通常而言,互聯(lián)網(wǎng)不良信息是指對互聯(lián)網(wǎng)安全、社會運行秩序、大多數(shù)網(wǎng)民的利益構(gòu)成嚴(yán)重威脅的信息內(nèi)容。但不同國家對于互聯(lián)網(wǎng)不良信息的定義又有所不同,就國內(nèi)治理實踐而言,最為泛濫的互聯(lián)網(wǎng)不良信息主要是涉黃涉賭信息,本文所指互聯(lián)網(wǎng)不良信息治理對象即主要為以下兩類。
互聯(lián)網(wǎng)不良信息繼承了傳統(tǒng)的不良信息傳播的所有危害,是互聯(lián)網(wǎng)高度普及背景下的犯罪新形式。
3.1.1 違法行為隱蔽性強(qiáng),查處難度大
違法分子為逃避國內(nèi)執(zhí)法部門的打擊,通常將服務(wù)器架設(shè)在境外,與國外不法集團(tuán)相互聯(lián)系,同時在國內(nèi)尋找和發(fā)展代理人進(jìn)行網(wǎng)絡(luò)運營。網(wǎng)絡(luò)數(shù)據(jù)更新頻繁,打擊此類行為對技術(shù)要求較高,再加上國內(nèi)外的認(rèn)定不同,有些國家和地區(qū)甚至將此類違法活動為了逃避罪責(zé),作了非罪化處理,進(jìn)一步加大了我國司法機(jī)關(guān)在跨國偵查辦案時的取證難度。
3.1.2 往往以集團(tuán)模式出現(xiàn)
此類違法體系性很強(qiáng),組織嚴(yán)謹(jǐn)、層級清晰,一般包括網(wǎng)絡(luò)搭建、規(guī)則制定、人員組織、金融服務(wù)以及宣傳等部分,其嚴(yán)密性與傳銷組織無異[2]。
3.1.3 運營高效、參與門檻低
參與非常便利,參與人員只要在代理人處獲得網(wǎng)站的賬號和密碼,便可以隨時隨地參與。成百上千人背后往往僅有幾臺甚至只有一臺電腦進(jìn)行操控,賭資通過第三方支付平臺進(jìn)行流轉(zhuǎn)。這些便捷性和高“安全性”,助推了此類違法行為的泛濫。
3.1.4 涉案資金巨大,嚴(yán)重破壞了我國金融秩序
相較于傳統(tǒng),新型網(wǎng)絡(luò)違法行為往往涉案資金巨大,在已查處的案件中,涉及資金為百萬、千萬金額的案件在某種程度上都屬于小案,這嚴(yán)重破壞了我國金融秩序。
3.1.5 嚴(yán)重影響青少年身心健康
青少年是使用互聯(lián)網(wǎng)的活躍群體,同時也是社會經(jīng)驗不足、思想不成熟的人群。在查處的案件中,有很多初中生、高中生參與其中。據(jù)某少管所統(tǒng)計,因參與其中而導(dǎo)致犯罪的青少年約占總?cè)藬?shù)的32%,嚴(yán)重侵蝕著青少年的身心健康,對社會的危害已經(jīng)觸及國家根基。
3.2.1 敗壞社會道德與風(fēng)氣
網(wǎng)絡(luò)不良信息長期泛濫,嚴(yán)重影響了網(wǎng)民的道德觀、價值觀,不道德的觀念被當(dāng)成理所當(dāng)然,久而久之會使得全社會處于一種不良的環(huán)境中,敗壞社會的道德與風(fēng)氣。
3.2.2 引發(fā)犯罪行為
不良信息本身就具有巨大危害性,人們在此類信息的長期腐蝕下,會失去傳統(tǒng)觀念,引發(fā)犯罪。許多網(wǎng)絡(luò)不良信息的發(fā)布者為了獲取更多經(jīng)濟(jì)利益,會發(fā)布更加危險的內(nèi)容來吸引人們的目光,誘導(dǎo)人們一步一步走向極端,增加社會犯罪率。
3.2.3 危害青少年的身心健康
根據(jù)2016年共青團(tuán)中央發(fā)布的首份《互聯(lián)網(wǎng)不良信息對青少年的危害分析白皮書》顯示,近80%的未成年人通過電腦、手機(jī)等接觸過不良信息。青少年處于青春發(fā)育期,他們的意識正處于懵懂狀態(tài)。內(nèi)心的叛逆,加上我國文化觀念相對保守,使得網(wǎng)絡(luò)不良信息對他們極具誘惑力。青少年沉迷于此,會偏離人生正確的軌跡,甚至走上犯罪道路。
近年來,基礎(chǔ)電信運營商持續(xù)開展互聯(lián)網(wǎng)不良信息治理工作,取得了顯著成效。
2008年,由工信部牽頭,三大基礎(chǔ)電信運營商聯(lián)合開展垃圾短信息整治專項行動, 依法嚴(yán)厲查處群發(fā)垃圾短信息的信息服務(wù)業(yè)務(wù)經(jīng)營者,清理了一批擅自濫發(fā)違法有害短信息內(nèi)容的短信端口、手機(jī)服務(wù)、群發(fā)設(shè)備,有力遏制了垃圾短信泛濫態(tài)勢,短信息服務(wù)環(huán)境明顯凈化。
2009年,三大基礎(chǔ)電信運營商簽訂《關(guān)于網(wǎng)間垃圾短信聯(lián)動處理框架協(xié)議》,制定了各基礎(chǔ)運營企業(yè)聯(lián)手處理跨網(wǎng)垃圾短信的具體合作流程。協(xié)議的實施,加強(qiáng)了基礎(chǔ)運營企業(yè)的協(xié)同配合,切實解決了網(wǎng)間垃圾短信息的濫發(fā)問題,進(jìn)一步鞏固了垃圾短信治理成果,有效保護(hù)了電信用戶的合法權(quán)益。
2012年,再次組織開展端口類短信群發(fā)業(yè)務(wù)清理整頓專項行動,包括利用基礎(chǔ)電信企業(yè)自有端口和行業(yè)類應(yīng)用端口、信息服務(wù)經(jīng)營者自有端口和個人通信號碼(含小靈通號碼、手機(jī)號碼和固定號碼等)開展的經(jīng)營性群發(fā)垃圾短信的行為得到了有效整頓。
2005年、2009年基礎(chǔ)電信運營在工信部統(tǒng)一組織下,對代收費行為進(jìn)行整頓規(guī)范,與代收費合作伙伴簽署信息安全承諾書,強(qiáng)化對內(nèi)容管理責(zé)任的落實,堅決杜絕與手機(jī)網(wǎng)站采取合作分成方式傳播不良信息。
2009年,基礎(chǔ)電信運營商配合全國“掃黃打非”辦公室,針對手機(jī)網(wǎng)站制作、傳播不良信息活動不斷蔓延的情況進(jìn)行了專項治理。打擊為手機(jī)不良網(wǎng)站提供網(wǎng)絡(luò)接入、建站、增值服務(wù)、廣告推廣、代收費等服務(wù)內(nèi)容,整改關(guān)閉違法違規(guī)網(wǎng)站3.3萬個,斬斷手機(jī)不良網(wǎng)站背后的利益鏈條。
2011年以來,在工信部統(tǒng)籌下,基礎(chǔ)電信運營商組織人力持續(xù)開展“凈網(wǎng)行動”,對互聯(lián)網(wǎng)違法信息開展撥測,對網(wǎng)絡(luò)接入、重點業(yè)務(wù)平臺等環(huán)節(jié)加強(qiáng)安全管控。
為適應(yīng)互聯(lián)網(wǎng)不良信息治理的發(fā)展趨勢,各基礎(chǔ)電信運營商還不斷提升對互聯(lián)網(wǎng)不良信息的技術(shù)監(jiān)測能力,逐步將治理環(huán)節(jié)向下延伸,很多省級公司也已陸續(xù)建成相關(guān)系統(tǒng),全域監(jiān)測、處置互聯(lián)網(wǎng)不良信息的能力顯著增強(qiáng)[3]。
目前,各省級基礎(chǔ)電信運營商已逐步建立了省級互聯(lián)網(wǎng)不良信息處置管控體系。
省級基礎(chǔ)電信運營商作為互聯(lián)網(wǎng)不良信息治理體系的重要一環(huán),在治理實踐中承擔(dān)著重要角色。對上,省級基礎(chǔ)電信運營商承接集團(tuán)公司、政府職能部門等上級單位有關(guān)治理政策和治理要求;對下,省級基礎(chǔ)電信運營商統(tǒng)籌本省范圍內(nèi)互聯(lián)網(wǎng)不良信息處置管控體系建設(shè)與有序運作。

圖1 協(xié)同統(tǒng)籌的管控體系
預(yù)防是指通過規(guī)范網(wǎng)站接入、網(wǎng)站備案和網(wǎng)絡(luò)信息安全等日常運營管理工作,化解互聯(lián)網(wǎng)不良信息產(chǎn)生的潛在風(fēng)險,構(gòu)建第一道屏障。
監(jiān)測是指通過建立互聯(lián)網(wǎng)不良信息監(jiān)測掃描系統(tǒng)、網(wǎng)站備案監(jiān)測系統(tǒng)等自動化技術(shù)平臺,提升對互聯(lián)網(wǎng)不良信息檢查的掃描效率、掃描深度、識別精度,為精準(zhǔn)打擊提供技術(shù)保障。
處置是指建立穿透省市縣三級的互聯(lián)網(wǎng)不良信息工單處置流程,規(guī)范和閉環(huán)管理全省不良信息處置工作,確保處置效果。
宣教是指梳理有關(guān)互聯(lián)網(wǎng)不良信息治理的國家法律、法規(guī)和常見問題,對廣大員工和客戶開展宣傳教育,促使全社會知法懂法,逐步培養(yǎng)起主動抵制互聯(lián)網(wǎng)不良信息和協(xié)同治理的自覺意識。
傳統(tǒng)人工撥測方式效率低下、費時耗力,建立互聯(lián)網(wǎng)不良信息技術(shù)監(jiān)測平臺,可實現(xiàn)高強(qiáng)度、大覆蓋面的自動掃描和識別發(fā)現(xiàn),對提升治理效率意義重大。互聯(lián)網(wǎng)不良信息技術(shù)監(jiān)測從組成上來說,核心部分主要是網(wǎng)頁數(shù)據(jù)采集和不良信息分析識別兩塊[4]。
5.2.1 網(wǎng)頁數(shù)據(jù)采集
互聯(lián)網(wǎng)不良信息網(wǎng)頁數(shù)據(jù)采集方面分為用于主動采集的網(wǎng)絡(luò)爬蟲技術(shù)和應(yīng)用于被動檢測的DPI技術(shù)。前者在應(yīng)用層通過HTTP協(xié)議進(jìn)行信息采集,后者先在網(wǎng)絡(luò)層復(fù)制數(shù)據(jù)包,再采用DPI技術(shù)從中提取出相關(guān)內(nèi)容信息。
(1)網(wǎng)絡(luò)爬蟲技術(shù)。網(wǎng)絡(luò)爬蟲技術(shù)是搜索引擎的核心技術(shù)之一,被谷歌、百度等互聯(lián)網(wǎng)公司廣泛采用,也是目前最主要的不良信息主動發(fā)現(xiàn)技術(shù)手段。
網(wǎng)絡(luò)爬蟲實際上是一個自動提取網(wǎng)頁內(nèi)容的程序。它從網(wǎng)站首頁開始收集網(wǎng)頁內(nèi)容,并通過不斷抓取網(wǎng)頁上的URL鏈接,逐層深入次級網(wǎng)頁,進(jìn)而實現(xiàn)對整個網(wǎng)站所有頁面的內(nèi)容搜集[5]。

圖2 網(wǎng)絡(luò)爬蟲技術(shù)的基本工作原理
(2)DPI技術(shù)。DPI即深度包檢測,也是一種常用的不良信息采集方式。通過鏡像操作實現(xiàn)對網(wǎng)絡(luò)流量抓取,再將抓取到的數(shù)據(jù)包進(jìn)行拆包,進(jìn)而提取出相關(guān)內(nèi)容信息。DPI技術(shù)在分析包頭的基礎(chǔ)上,增加了對應(yīng)用層的分析,能得到詳細(xì)內(nèi)容。
5.2.2 不良信息分析識別
(1)傳統(tǒng)信息識別技術(shù)。傳統(tǒng)信息識別,主要是采用關(guān)鍵詞匹配技術(shù),關(guān)鍵詞庫則是通過長期運營不斷積累從而變得豐富。在實施信息識別時,若發(fā)現(xiàn)文本中出現(xiàn)關(guān)鍵詞,則認(rèn)為該文本屬于不良信息,若文本中沒有出現(xiàn)關(guān)鍵詞,則認(rèn)為該文本不屬于不良信息。關(guān)鍵詞匹配在技術(shù)實現(xiàn)上較為簡單,但由于漢語的語言特性,上下文語義與關(guān)鍵詞本意不一致時,關(guān)鍵詞匹配會導(dǎo)致較高誤判率。另外,通過同音字替換、關(guān)鍵詞變形等,也容易規(guī)避匹配。
不良信息分析識別能力的提升,需要經(jīng)過長期運營積累,通過對識別系統(tǒng)的不斷訓(xùn)練,逐步提升覆蓋面和優(yōu)化精準(zhǔn)度(圖3)。從原理上講,對文本、圖像、視頻的不良信息識別是一樣的,但是,由于圖像、視頻需要經(jīng)過特征表示、特征抽取、特征降維等多個額外數(shù)據(jù)處理環(huán)節(jié)才能提取出文字,這也導(dǎo)致圖像、視頻的識別精度不高。

圖3 不良信息分析識別能力訓(xùn)練
AI內(nèi)容檢測。相較于傳統(tǒng)關(guān)鍵詞匹配識別技術(shù),AI機(jī)器學(xué)習(xí)在對文本識別時,會更側(cè)重于文本的語義信息,對于諧音詞、錯別字以及“黑話”等會有較大的容錯能力(圖4)。即使在沒有匹配到違規(guī)關(guān)鍵詞時,只要其文本語義帶有不良信息的特征,一樣也能被檢測出來。當(dāng)然,AI機(jī)器學(xué)習(xí)也依賴于大量的樣本訓(xùn)練,如果不良特征信息過少,AI機(jī)器學(xué)習(xí)模型仍需要傳統(tǒng)關(guān)鍵詞匹配技術(shù)來進(jìn)行補(bǔ)充。

圖4 AI機(jī)器學(xué)習(xí)方案卷積神經(jīng)網(wǎng)絡(luò)卷積操作示意圖
5.2.3 自主掃描監(jiān)測平臺
本省互聯(lián)網(wǎng)不良信息監(jiān)測系統(tǒng)主要分成三層:第一層是數(shù)據(jù)采集層,主要采集解析來自DNS和DPI的話單,識別出基礎(chǔ)數(shù)據(jù);第二層是數(shù)據(jù)處理層,通過高性能數(shù)據(jù)處理引擎,進(jìn)行網(wǎng)站狀態(tài)判斷、接入判斷、網(wǎng)站內(nèi)容識別、信息內(nèi)容監(jiān)測及處置管理等;第三層是可視化呈現(xiàn)層,主要實現(xiàn)結(jié)果展示、任務(wù)派發(fā)、策略配置管理等(圖5)[6]。

圖5 系統(tǒng)結(jié)構(gòu)與功能組成
經(jīng)過不懈努力,省級基礎(chǔ)電信運營商在互聯(lián)網(wǎng)不良信息治理方面已經(jīng)取得了長足進(jìn)展,隨著技術(shù)監(jiān)測平臺的上線,互聯(lián)網(wǎng)不良信息治理工作如虎添翼,大量包含不良內(nèi)容的網(wǎng)頁、鏈接被揭露出來并得到整改。
圖6展示了筆者所在省從2020年6月-2021年12月所處置的不良信息網(wǎng)頁數(shù)量,從數(shù)據(jù)角度對治理成效作了直觀展現(xiàn)。

圖6 2020年6月-2021年12月本省自主發(fā)現(xiàn)并處置的互聯(lián)網(wǎng)不良信息網(wǎng)頁情況
在國家相關(guān)主管部門和集團(tuán)公司的大力推動下,省級基礎(chǔ)電信運營商在互聯(lián)網(wǎng)不良信息治理方面成績斐然。但是,在具體治理實踐中,仍然存在很多困難,仍需要全社會通力協(xié)作,逐步加以解決。
5.4.1 網(wǎng)站基數(shù)龐大,網(wǎng)頁數(shù)規(guī)模持續(xù)快速增長
隨著互聯(lián)網(wǎng)的持續(xù)快速發(fā)展,我國網(wǎng)站和網(wǎng)頁數(shù)量也呈現(xiàn)出爆炸式增長。截至2021年12月,我國網(wǎng)站數(shù)量為418萬個,網(wǎng)頁數(shù)量為3350億個。海量網(wǎng)頁數(shù)據(jù)給內(nèi)容撥測、監(jiān)測設(shè)置了很高的門檻,基礎(chǔ)電信運營商必須投入大量算力和帶寬,才能盡量確保日常監(jiān)測掃描的時效性。
5.4.2 監(jiān)測技術(shù)需要持續(xù)完善
伴隨互聯(lián)網(wǎng)快速發(fā)展的,不僅只有網(wǎng)頁數(shù)量的激增,還有互聯(lián)網(wǎng)業(yè)務(wù)承載模式的不斷創(chuàng)新升級和迭代。從傳統(tǒng)網(wǎng)站到APP、公眾號、小程序,從靜態(tài)網(wǎng)頁到動態(tài)腳本網(wǎng)頁,從文本信息到圖文并茂、語音視頻相結(jié)合的富媒體,互聯(lián)網(wǎng)的呈現(xiàn)方式愈加多元化。
基礎(chǔ)電信運營持續(xù)開展互聯(lián)網(wǎng)不良信息治理的同時,違法犯罪分子也在不斷改變不良信息的呈現(xiàn)方式、不斷調(diào)整應(yīng)對監(jiān)測檢查的技術(shù)手段。不良信息內(nèi)容、不良信息鏈接從顯眼位置向隱蔽位置轉(zhuǎn)移、從靜態(tài)內(nèi)容向動態(tài)腳本轉(zhuǎn)移。當(dāng)前的互聯(lián)網(wǎng)不良信息監(jiān)測,已遠(yuǎn)非傳統(tǒng)人海戰(zhàn)術(shù)、人工撥測所能解決,對已經(jīng)部署的全自動技術(shù)監(jiān)測手段也提出了更高要求。
5.4.3 治理工作并未形成合力
互聯(lián)網(wǎng)不良信息治理工作需要全社會群策群力,但就實踐而言,治理工作并未形成合力。在域名管理方面,由于域名注冊門檻很低,在日常處置實踐中,查處的不良網(wǎng)站通常使用稀奇古怪的域名。在客戶內(nèi)部管理方面,由于對域名疏于管理,被不法分子搶注用于開設(shè)不良網(wǎng)站的情況時有發(fā)生,由于不重視網(wǎng)絡(luò)安全和內(nèi)部人員管理,網(wǎng)絡(luò)“肉雞”情況也很常見。在技術(shù)廠家方面,由于經(jīng)濟(jì)利益考慮,相互之間互相保密,形成技術(shù)壁壘。在國際協(xié)作方面,絕大部分不良網(wǎng)站開設(shè)在境外國家,無法予以根除。總之,全社會未形成合力的例子林林總總,不勝枚舉。
網(wǎng)絡(luò)不是法外之地,網(wǎng)絡(luò)空間的健康發(fā)展需要所有參與主體的共同努力,任重而道遠(yuǎn)。現(xiàn)階段,互聯(lián)網(wǎng)不良信息綜合治理中盡管還存在著種種問題,但隨著法律法規(guī)的不斷完善、監(jiān)管監(jiān)督職責(zé)的進(jìn)一步明確、技術(shù)手段日益創(chuàng)新升級、國際合作的廣泛開展,我們有理由相信,全社會必定能夠搭建起良性互動的框架,共同打造自由便捷、綠色健康的互聯(lián)網(wǎng)。