姜劍鋒
摘? 要? 大數據技術作為信息社會發展中的重要資源,在信息管理方面發揮著不可替代的作用。利用大數據技術,為互聯網引入“信息淘汰”機制,對海量信息進行高效率的處理,裨補以往發展中的缺漏,營造精簡、實用的網絡,從而帶給受眾互聯網新體驗,推動信息行業新發展。
關鍵詞? 大數據;信息行業;“信息淘汰”;受眾困擾
隨著云時代的到來,大數據吸引了越來越多的關注。但是,在信息時代的大背景下,受眾面對海量信息篩選難度增大,而信息行業發展也日見亂象頻生,利用大數據對其進行處理,很有必要。
1? 大數據的基本內容
1.1? 大數據的概念
2008年8月中旬,維克托·邁爾-舍恩伯格及肯尼斯·庫克耶首次提出“大數據(Big Data)”的概念,大數據(Big Data)技術是指利用云計算的分布式處理、分布式數據庫和云存儲、虛擬化技術對海量數據進行甄別、篩選和處理,從而求得更為準確、有效的數據信息,實現數據價值的最大化。
1.2? 大數據的特點
就目前大數據發展狀況來看,主要呈現出以下幾個特點。第一,大量而高速。大數據技術可在較短的時間內處理較大的信息量,和傳統的隨機分析法相比較,大數據技術采用數據覆蓋面廣,計算周期短。第二,低價值密度。在常態的數據處理中,數據采集不及時、樣本不全面、處理誤差大等因素會造成數據失真,難以得到精準的信息。第三,多樣而真實。大數據可將不同數據源、不同數據樣本進行甄別,篩選處理,使非結構化數據轉化為結構化數據[1]。
1.3? 大數據的發展趨勢
一方面,大數據正占據著科技前沿的位置,成為新一代技術革命中的重要資源[2]。數據挖掘、人工智能、經濟市場都日漸依賴于大數據強大的處理能力。掌握大數據,即掌握數據生態系統話語的主導權。
另一方面,大數據在發展過程中,數據源缺乏相應的管理措施,對個人信息挖掘過度,造成隱私泄露;數據造假,許多人在不知情的情況下繼續使用,從而產生一系列問題。
1.4? 大數據與信息時代
信息時代帶給人們的影響是雙向的,通過大眾傳媒的雙重屬性理論,我們可知,一方面,網絡媒介具有準入門檻低、媒介種類多、受眾范圍廣等優點,可在最大程度上突破時空的局限性,另一方面,網絡媒介把整個世界呈現在人們眼前,但部分新聞失實,誤導受眾;豐富了知識,卻降低了人們的思考能力。目前,大數據技術在為信息行業提供服務時,只停留在為受眾提供個性化推薦的層面,而沒有做到過濾信息中的非實用部分,即主要通過對讀者的年齡、性別、地域、愛好、等進行研究,從而進行信息推薦,卻往往忽視了受眾出于獵奇心理、短暫追求愉悅等主觀化的特點。相當一部分學者對信息過載、信息不實等問題進行批評,呼吁信息勿失價值性。
2? “信息淘汰“機制的引入及可行性分析
2.1? “信息淘汰”機制的概念
“信息淘汰”機制是指利用大數據結構化處理的優勢,在極其有限的時間內,發揮信息處理量大、速度快,低價值密度的特點,充當媒介“把關人”的角色,對網絡虛假、重復、實用價值低的信息進行剔除、淘汰,從而使互聯網信息報道向優質化,精簡化發展。
2.2? “信息淘汰”機制的引入
2.2.1? 議程設置和選擇算法的宏觀引入
就當前信息傳播形式而言,信息量和傳播速度日趨龐大,把握信息的主流方向,必不可少。在宏觀層面上,主要借助于兩種方式:主流媒體的“議程設置功能”和大數據的選擇算法。
基于當前主流媒體的影響力,可在信息傳播過程中主動進行“議程設置”。再者,在傳播過程中,適時對低質量、低價值的信息進行議題干涉,排斥此類議題的深入長期發展,達到“信息淘汰”的目的。最后,可通過“公共議題”的引入,將此類信息展現在受眾面前,依托有效的受眾評論,轉變信息從業者的生產方向,達到信息的凈化。
同時,可以利用好數據挖掘的“選擇算法”。“選擇算法”主要分為三類:一是“分類算法”,主要采用VSM法,建立類別向量空間,計算文本相似度,點面結合,剔除無效信息;二是“聚類算法”,可通過“自頂而下”層次的劃分來實現信息的篩選。設定一定的數據條件,提高層次聚類質量,過濾低層次遺留信息;三是“關聯規則算法”,基于支持度公式:support(XY)= P(XY),收集用戶設定的閾值,排查出一定數目的信息類別;再根據信任度公式:support(XY)/support(X),挖掘頻繁出現的無效信息,達到最終“淘汰”目的。
2.2.2? 用戶群評論和“社區文化”的微觀引入
考慮到網民基數以及主觀意愿的表達欲望,在微觀層面上,可從用戶個體出發,借助用戶群評論和“社區”進行“信息淘汰”機制的引入。
第一,利用用戶群評論判斷信息的有效性。“信息淘汰”機制的引入,本身就服務于互聯網信息受眾,通過收集受眾對信息的評論,可形成較為有力的沖擊,制約同質信息的再生產。第二,利用“社區文化”排斥低俗信息。“社區”指的是一些或多數網民通過興趣愛好、習俗宗教、情感歸屬構成的類似社區的網絡群體,而“社區”中必然存在共同的喜好和追求。通過加強“社區文化”的構建和管理,可形成自下而上的管理機制,由點到面,遏制低質信息的傳播。
2.2.3? Hadoop的實踐嘗試
Hadoop是一個能夠對大量數據進行分布式處理的軟件框架,在近些年,借助集群的方式對信息進行高速運算和儲存,使它在Internet的發展過程中廣受歡迎。在最初使用時,Hadoop主要被用于做網絡索引,主要亮點是擴展性強、可靠高效、成本較低。就利用它來運行“信息淘汰”機制,可以說是一次相當大的嘗試。一方面,它非常適合針對敏感信息進行處理,可行性較強,但是另一方面,它雖然高速發展,但仍有相當多的不足亟待完善,諸如政府制度、行業行規,數據調取管理等等。隨著相關問題的解決,相信它在“信息淘汰”機制運行的路上必將走得更遠。
3? “信息淘汰”機制的積極作用
3.1? “信息淘汰”機制對受眾的作用
基于“信息淘汰”機制,一方面,可使受眾層得到真實、有效、低重復率、實用性強的信息,從而降低使用率,激發受眾層的創造力和對信息的利用率,另一方面,可使受眾層對信息的信任程度增強,弱化不良輿論及惡意信息對受眾層的干擾,帶給受眾綠色、干凈、高效的互聯網新體驗。
3.2? “信息淘汰”機制對信息行業的作用
對于信息從業者來說,“信息淘汰”機制的引入可規范其信息生產內容,監督其信息生產質量,從而提高其對優質報道的追求,對行業的認知度和社會責任感。對于信息行業來說,“信息淘汰”機制可以促進信息行業的持久發展,抵制低質量、差內容的信息,避免資源浪費,從而淘汰一批“僵尸”信息產業,盤活行業新發展,提高社會整體活性,帶動經濟整體增長。
3.3? “信息淘汰”機制對監管者的作用
就當今信息監管情況而言,“信息淘汰”機制的引入,將在技術完善和制度完善兩方面起到作用,進而提高互聯網監管效果。首先,在技術完善方面,“信息淘汰”機制會修補原有監察系統的缺漏,提高監察力度,簡化監察形式,提高監察效率;其次,在制度完善方面,“信息淘汰”機制能夠起到“硬控制”的作用,全面原有制度,調節信息生產方向,從而約束信息生產,并最終達到降低互聯網管理難度的目標。
4? 結語
綜上所述,在當今信息時代高速發展的背景下,大數據技術持續深入發展,各行各業利用大數據進行分析處理的現象屢見不鮮。就承擔傳遞信息、控制社會輿情、服務大眾利益的信息行業來說,更需要肩負起身為公眾媒介的責任。利用大數據,為互聯網引入“淘汰”機制,將幫助互聯網信息進行有效的改變,對受眾而言,可以得到高質量的信息;對產業而言,可以促進其發展,提高信息質量;對社會而言,使此機制能彌補當今社會中信息發展不充分、不協調、不全面的問題,推動互聯網綠色、高效、精簡化構建。
參考文獻
[1]劉春生.計算機數據庫技術在信息管理中的實踐與應用[J].科學技術創新,2019(29):87-88.
[2]羅曼.大數據技術在計算機網絡信息管理中的應用[J].電子技術與軟件工程,2019(20):150-151.