基于大數據的互聯網“信息淘汰”機制分析

2020-05-15 13:35:39姜劍鋒

新媒體研究 2020年2期

姜劍鋒

摘? 要? 大數據技術作為信息社會發展中的重要資源，在信息管理方面發揮著不可替代的作用。利用大數據技術，為互聯網引入“信息淘汰”機制，對海量信息進行高效率的處理，裨補以往發展中的缺漏，營造精簡、實用的網絡，從而帶給受眾互聯網新體驗，推動信息行業新發展。

關鍵詞? 大數據;信息行業;“信息淘汰”;受眾困擾

隨著云時代的到來，大數據吸引了越來越多的關注。但是，在信息時代的大背景下，受眾面對海量信息篩選難度增大，而信息行業發展也日見亂象頻生，利用大數據對其進行處理，很有必要。

1? 大數據的基本內容

1.1? 大數據的概念

2008年8月中旬，維克托·邁爾-舍恩伯格及肯尼斯·庫克耶首次提出“大數據（Big Data）”的概念，大數據（Big Data）技術是指利用云計算的分布式處理、分布式數據庫和云存儲、虛擬化技術對海量數據進行甄別、篩選和處理，從而求得更為準確、有效的數據信息，實現數據價值的最大化。

1.2? 大數據的特點

就目前大數據發展狀況來看，主要呈現出以下幾個特點。第一，大量而高速。大數據技術可在較短的時間內處理較大的信息量，和傳統的隨機分析法相比較，大數據技術采用數據覆蓋面廣，計算周期短。第二，低價值密度。在常態的數據處理中，數據采集不及時、樣本不全面、處理誤差大等因素會造成數據失真，難以得到精準的信息。第三，多樣而真實。大數據可將不同數據源、不同數據樣本進行甄別，篩選處理，使非結構化數據轉化為結構化數據[1]。

1.3? 大數據的發展趨勢

一方面，大數據正占據著科技前沿的位置，成為新一代技術革命中的重要資源[2]。數據挖掘、人工智能、經濟市場都日漸依賴于大數據強大的處理能力。掌握大數據，即掌握數據生態系統話語的主導權。

另一方面，大數據在發展過程中，數據源缺乏相應的管理措施，對個人信息挖掘過度，造成隱私泄露;數據造假，許多人在不知情的情況下繼續使用，從而產生一系列問題。

1.4? 大數據與信息時代

信息時代帶給人們的影響是雙向的，通過大眾傳媒的雙重屬性理論，我們可知，一方面，網絡媒介具有準入門檻低、媒介種類多、受眾范圍廣等優點，可在最大程度上突破時空的局限性，另一方面，網絡媒介把整個世界呈現在人們眼前，但部分新聞失實，誤導受眾;豐富了知識，卻降低了人們的思考能力。目前，大數據技術在為信息行業提供服務時，只停留在為受眾提供個性化推薦的層面，而沒有做到過濾信息中的非實用部分，即主要通過對讀者的年齡、性別、地域、愛好、等進行研究，從而進行信息推薦，卻往往忽視了受眾出于獵奇心理、短暫追求愉悅等主觀化的特點。相當一部分學者對信息過載、信息不實等問題進行批評，呼吁信息勿失價值性。

2? “信息淘汰“機制的引入及可行性分析

2.1? “信息淘汰”機制的概念

“信息淘汰”機制是指利用大數據結構化處理的優勢，在極其有限的時間內，發揮信息處理量大、速度快，低價值密度的特點，充當媒介“把關人”的角色，對網絡虛假、重復、實用價值低的信息進行剔除、淘汰，從而使互聯網信息報道向優質化，精簡化發展。

2.2? “信息淘汰”機制的引入

2.2.1? 議程設置和選擇算法的宏觀引入

就當前信息傳播形式而言，信息量和傳播速度日趨龐大，把握信息的主流方向，必不可少。在宏觀層面上，主要借助于兩種方式：主流媒體的“議程設置功能”和大數據的選擇算法。

基于當前主流媒體的影響力，可在信息傳播過程中主動進行“議程設置”。再者，在傳播過程中，適時對低質量、低價值的信息進行議題干涉，排斥此類議題的深入長期發展，達到“信息淘汰”的目的。最后，可通過“公共議題”的引入，將此類信息展現在受眾面前，依托有效的受眾評論，轉變信息從業者的生產方向，達到信息的凈化。

同時，可以利用好數據挖掘的“選擇算法”。“選擇算法”主要分為三類：一是“分類算法”，主要采用VSM法，建立類別向量空間，計算文本相似度，點面結合，剔除無效信息;二是“聚類算法”，可通過“自頂而下”層次的劃分來實現信息的篩選。設定一定的數據條件，提高層次聚類質量，過濾低層次遺留信息;三是“關聯規則算法”，基于支持度公式：support（XY）= P（XY），收集用戶設定的閾值，排查出一定數目的信息類別;再根據信任度公式：support（XY）/support（X），挖掘頻繁出現的無效信息，達到最終“淘汰”目的。

2.2.2? 用戶群評論和“社區文化”的微觀引入

考慮到網民基數以及主觀意愿的表達欲望，在微觀層面上，可從用戶個體出發，借助用戶群評論和“社區”進行“信息淘汰”機制的引入。

第一，利用用戶群評論判斷信息的有效性。“信息淘汰”機制的引入，本身就服務于互聯網信息受眾，通過收集受眾對信息的評論，可形成較為有力的沖擊，制約同質信息的再生產。第二，利用“社區文化”排斥低俗信息。“社區”指的是一些或多數網民通過興趣愛好、習俗宗教、情感歸屬構成的類似社區的網絡群體，而“社區”中必然存在共同的喜好和追求。通過加強“社區文化”的構建和管理，可形成自下而上的管理機制，由點到面，遏制低質信息的傳播。

2.2.3? Hadoop的實踐嘗試

Hadoop是一個能夠對大量數據進行分布式處理的軟件框架，在近些年，借助集群的方式對信息進行高速運算和儲存，使它在Internet的發展過程中廣受歡迎。在最初使用時，Hadoop主要被用于做網絡索引，主要亮點是擴展性強、可靠高效、成本較低。就利用它來運行“信息淘汰”機制，可以說是一次相當大的嘗試。一方面，它非常適合針對敏感信息進行處理，可行性較強，但是另一方面，它雖然高速發展，但仍有相當多的不足亟待完善，諸如政府制度、行業行規，數據調取管理等等。隨著相關問題的解決，相信它在“信息淘汰”機制運行的路上必將走得更遠。

3? “信息淘汰”機制的積極作用

3.1? “信息淘汰”機制對受眾的作用

基于“信息淘汰”機制，一方面，可使受眾層得到真實、有效、低重復率、實用性強的信息，從而降低使用率，激發受眾層的創造力和對信息的利用率，另一方面，可使受眾層對信息的信任程度增強，弱化不良輿論及惡意信息對受眾層的干擾，帶給受眾綠色、干凈、高效的互聯網新體驗。

3.2? “信息淘汰”機制對信息行業的作用

對于信息從業者來說，“信息淘汰”機制的引入可規范其信息生產內容，監督其信息生產質量，從而提高其對優質報道的追求，對行業的認知度和社會責任感。對于信息行業來說，“信息淘汰”機制可以促進信息行業的持久發展，抵制低質量、差內容的信息，避免資源浪費，從而淘汰一批“僵尸”信息產業，盤活行業新發展，提高社會整體活性，帶動經濟整體增長。

3.3? “信息淘汰”機制對監管者的作用

就當今信息監管情況而言，“信息淘汰”機制的引入，將在技術完善和制度完善兩方面起到作用，進而提高互聯網監管效果。首先，在技術完善方面，“信息淘汰”機制會修補原有監察系統的缺漏，提高監察力度，簡化監察形式，提高監察效率;其次，在制度完善方面，“信息淘汰”機制能夠起到“硬控制”的作用，全面原有制度，調節信息生產方向，從而約束信息生產，并最終達到降低互聯網管理難度的目標。

4? 結語

綜上所述，在當今信息時代高速發展的背景下，大數據技術持續深入發展，各行各業利用大數據進行分析處理的現象屢見不鮮。就承擔傳遞信息、控制社會輿情、服務大眾利益的信息行業來說，更需要肩負起身為公眾媒介的責任。利用大數據，為互聯網引入“淘汰”機制，將幫助互聯網信息進行有效的改變，對受眾而言，可以得到高質量的信息;對產業而言，可以促進其發展，提高信息質量;對社會而言，使此機制能彌補當今社會中信息發展不充分、不協調、不全面的問題，推動互聯網綠色、高效、精簡化構建。

參考文獻

[1]劉春生.計算機數據庫技術在信息管理中的實踐與應用[J].科學技術創新，2019（29）：87-88.

[2]羅曼.大數據技術在計算機網絡信息管理中的應用[J].電子技術與軟件工程，2019（20）：150-151.