信息過濾技術的基本范疇
所謂信息過濾即信息的選擇性傳播。信息過濾關注受眾的長期需求,是為非結構化及半結構化的數據設計的,其目標是幫助用戶處理大量的信息,對動態的信息流進行篩選,排除用戶不希望得到的信息,基于用戶概型(profile)從輸入的信息流中過濾掉的數據。作為面向Intenet的個性化主動信息服務的一個重要中間環節,信息過濾技術近年來在信息的處理體系中應用得越來越廣泛。
信息過濾技術基本分為兩大類:一種是基于內容的信息過濾(Content-based Fil-tering);另一種是基于合作的信息過濾(Collabora-tive Filtering,又叫協同過濾或社會過濾)。
基于內容的信息過濾通過用戶模型(user profile)來描述用戶的信息需求,將新獲取的信息與用戶模型進行相似度計算,主動將相似度高的信息提供給用戶。這種過濾技術已經比較成熟,使用也相對較廣,它的主要缺點在于:隨著信息的劇增,效率和質量會降低;使用過程中難以發現新的感興趣的信息;一旦過濾方法選擇錯誤,后果將很嚴重。基于寫作的過濾技術根據人的判斷為用戶過濾信息,它使用多個用戶的只是預測單個用戶的偏好根據相同或相近興趣的用戶對應信息做出評價,向其用戶進行推薦。由于不依賴于內容,這種模式不僅適用于文本格式,也可以適用于非文本介質的資源,如視頻、音頻等。其優點在于能為用戶發現新的感興趣的信息,但是,它也存在兩個致命的缺陷:一是稀疏性問題,即在系統使用初期,由于系統資源還未獲取足夠的評價,系統很難利用這些評價來發現相似的用戶。另一缺陷是系統可擴展性,即隨著系統用戶和信息資源的增多,系統的性能會下降。
從技術層面來看,信息過濾技術更多關注的是信息受眾在獲取信息資源的過程中,為了全面、準確、方便、快捷地得到自己感興趣的信息所使用的一種技術手段。而之所以需要這種技術手段主要有以下幾方面的原因:
信息量的急劇膨脹。導致信息的獲取難度加大。隨著信息化進程的加快,存儲在網絡中的信息裂變式的爆炸,大量相同或相似信息的發布使人們對信息資源的準確查詢變得非常困難,因此客觀上需要有這么一種能夠過濾掉與用戶興趣需求不相符的信息,以供用戶選擇。
網絡信息污染嚴重,受眾客觀上需要這種信息過濾技術來抵制信息侵害、排除干擾。網絡的虛擬性為各種信息垃圾的發布與傳播提供了方便,大量不良信息的存在不僅嚴重污染了網絡生態環境,也給受眾正常的網絡生活造成了侵害,因此,受眾迫切需要諸如信息過濾技術等高水平的信息分流手段,以便不受網絡信息污染的危害。
網絡信息管理失控,建設網絡生態迫切需要從源頭上對信息進行過濾。作為網絡信息傳播的主管單位,政府有責任做好網絡世界的公共管理服務,為廣大民眾提供健康的、和諧的、有價值的信息資源。為此,政府必須從信息發布的源頭上把好信息質量關,擔當好“守門人”角色,這就需要運用信息過濾技術等技術手段,通過拒絕不良信息發布,跟蹤不良信息發布源,依法處理不良信息發布者,從而真正有效地管理網絡信息。
國內外基于信息過濾技術的網絡治污研究現狀
信息污染已經成為全世界共同關注的社會公害,網絡所鏈接的每一個受眾都是信息污染的直接受害者。因此,世界各國對于信息污染問題都給予了高度的關注,都非常重視網絡信息污染的治理。在充分認識到網絡信息污染的危害的背景下,世界各國首先想到的是利用法律的手段來維系網絡世界的純潔與有序。美國學者通過對網絡信息污染的研究,給政府提供了許多決策咨議,最后極大推動了美國國會通過CDA條例。盡管這一條例最終被聯邦法院裁決為無效,但它對促進其他各國的網絡信息管理功不可沒。1996年2月,德國政府內閣通過了《信息2000報告》,制定了全國統一的多媒體法,消滅Internet的不法和有害內容。同年,新加坡也制定了專門的法律對網絡傳輸的內容進行了規定,不準傳播黃色信息和對本國文化、社會穩定造成不安的信息等。隨著信息化進程的加快,網絡信息污染的日益嚴重,使各國都清楚地認識到單純依靠現實世界的管理手段無法駕馭網絡,因此,各國專家學者紛紛研究以技術對抗技術的網絡管理策略。
國內學者對信息污染問題的研究較早,研究內容主要集中在信息污染的定義、表現形式、成因、危害以及對策等方面,但多偏重于學理研究,且內容重復現象嚴重,概念混亂,可操作性方法研究較少。因此,我國網絡信息污染研究迫切需要建立起科學的預警檢測系統,迫切需要加快構建信息污染指標體系的研究,加強信道控制研究,加大力度研究國外信息污染治理的成功經驗,學習和借鑒國外的先進經驗和技術,加強網絡立法研究,以及提高網絡倫理素養途徑的研究。近年來,國內許多學者逐漸把研究的中心轉移到網絡信息治污的技術上來,尤其是借鑒國外的先進理念,把信息過濾技術引人網絡信息管理領域,逐漸在摸索信息過濾技術的網絡信息污染治理策略。如山東理工大學石巖對信息過濾技術模型的研究。江西藍天學院姚磊岳、熊建英等對基于中文分詞算法的信息過濾技術的研究提出了許多非常有價值的技術設想。而中國科學院聲學研究所黃曾婊先生潛心研究十幾年最終開發出的HNC網絡信息職能過濾器具備了立場判斷、內容審查的功能,使計算機能識別和處理人的語言,率先在世界上突破了立場判定難關,使中國網絡信息過濾技術達到了國際先進水平。
信息過濾技術的網絡治污價值
正是基于受眾對治理網絡信息污染的迫切需要,信息過濾技術對于治理網絡信息污染的意義才尤為重要。
首先,信息過濾技術在治理網絡信息污染過程中的應用,將有利于政府對網絡信息準入的宏觀管理。便于政府從源頭上凈化網絡環境。以HNC研究院開發的網絡信息職能過濾器進出口監控系統(HNC-XF4)為例,如果全國全部的互聯網國家級出口都安裝了該系統,將能夠有效監控有害信息,跟蹤重點對象,并及時發現問題,采取相應應對措施。最為重要的是,能夠極大地維護國家的信息安全,從源頭上杜絕進出國內外的各種不良信息。
其次,信息過濾技術的應用將有利于保障局域網絡不受其他信息的侵害。確保本網局域內的信息安全。信息過濾技術的開發與應用將能夠通過對信息內容的語意分析,辨別信息的屬性與類別,分辨信息的危害等級,確定信息的污染指數,從而自動采取應對措施,幫助用戶及時規避不良信息的侵害,規避網絡病毒的入侵,過濾用戶不需要的信息。
再次,信息過濾技術的開發與應用將極大地降低網絡信息使用的成本,為社會節約資源。近年來,信息污染表面上看主要表現在對現實生活的價值觀和道德底線的挑戰上,但從經濟學的角度來看,大量冗余信息、虛假信息、錯誤信息、污穢信息的存在加大了對有用信息的檢索難度,也大大降低了信息的可信度,因而導致了人們對信息使用的效率低下。而信息過濾技術的開發與應用將從源頭上阻擋一大部分不良信息,從而減輕網絡傳遞的負擔,也提高了信息資源的使用效益。
(程艷林、龐燕均為浙江大學傳媒技術碩士、浙江萬里學院文化與傳播學院助教)
編校:張紅玲