摘要:【目的】信息化時代的到來對新聞行業的發展具有積極促進作用。新聞行業已經逐漸從傳統新聞的采集模式轉變成了互聯網時代的新聞采集模式。在這一背景下,如何快速準確地獲取到所需要的新聞素材已經成為當前新聞行業所面臨的一個重要問題。【方法】文章結合信息化時代背景,分析新聞素材挖掘技術在新聞行業中的應用場景與應用優勢,剖析新聞素材挖掘技術的關鍵技術,從信息獲取、素材處理、媒體監測、輿情分析和事件報道五個方面論述新聞素材挖掘技術的具體應用。【結果】利用相關技術來對海量信息進行挖掘處理,快速準確地獲取所需要的新聞素材,提升工作效率。【結論】隨著技術的不斷進步和創新,新聞素材挖掘技術將會有更多的應用場景得到開發和實現,有效促進我國媒體行業更加健康快速的發展。
關鍵詞:信息時代;新聞素材;挖掘技術;應用研究;新聞數據" " " " " " "中圖分類號:G2" " " " " " " 文獻標識碼:A
文章編號:1671-0134(2023)05-064-04" " " " "DOI:10.19483/j.cnki.11-4653/n.2023.05.014
本文著錄格式:李云霞,李偉.信息化時代新聞素材挖掘技術的應用研究[J].中國傳媒科技,2023(05):64-67.
隨著社會的不斷發展,媒體行業也隨之不斷地發展。在新媒體環境下,傳統的媒體形式已經逐漸被取代,人們獲取信息的渠道越來越多,面臨的信息選擇也越來越多。這就對媒體行業提出了更高要求。如何在海量的信息中快速準確地獲取到自己需要的信息成為當前媒體行業所面臨的重要問題。因此,為了快速準確地獲取到所需要的新聞素材,就需要利用相關技術來對海量信息進行處理。
1.新聞素材挖掘技術在新聞行業中的應用場景與應用優勢
隨著信息化時代的不斷發展,互聯網已經成為人們獲取信息最主要的途徑之一。新聞素材是在某一特定領域中所具有的、能夠反映該領域內的客觀事實以及發展狀況的所有文字、聲音、圖像等資料總和。新聞素材挖掘技術是指將這些新聞素材進行挖掘處理,并最終提取出能夠反映當前社會現狀及意義、價值的重要信息。[1]
1.1" "應用場景
1.1.1" "從海量的信息中發現具有新聞價值的內容
隨著網絡技術的快速發展,信息的傳播變得越來越快,新聞事件的傳播速度也越來越快。為了能夠使新聞報道快速、全面、準確地傳播,需要從海量的新聞中進行篩選和提煉,挖掘出具有新聞價值的素材。傳統媒體在對新聞事件進行報道時,需要編輯人員對其進行整理和篩選,并從中找出有新聞價值的內容。而數據挖掘技術可以幫助編輯人員找到有新聞價值的內容,并將其提取出來,為媒體提供具有新聞價值的素材。
1.1.2" nbsp;挖掘出那些已經被其他媒體報道過的內容
從各種媒體報道中尋找具有新聞價值的內容,不僅可以幫助記者發現一些未被報道過的消息和事件,還可以幫助記者發現一些已經被其他媒體報道過,但并沒有被記者關注到的相關事件和人物。
1.1.3" "幫助分析采訪對象
在采訪過程中,記者會遇到各種各樣的人和事。通過對采訪對象進行分析,可以為記者提供一個具有價值的采訪對象。
1.2" "優勢
新聞素材挖掘技術在新聞報道中具有重要的應用優勢,可以幫助新聞從業者更好地把握事件脈搏,提高工作效率和精準度。[2]具體表現在:(1)通過該技術,實現對各種媒體平臺上發布的新聞信息進行全面獲取,包括文字、圖片、視頻等形式,不受時間和空間限制。(2)利用自然語言處理和機器學習等技術,快速對大量的新聞素材進行分析和分類,提高工作效率。(3)通過對新聞素材的挖掘和分析,追蹤事件的發展歷程,及時了解事件的最新進展和各方態度。(4)幫助新聞從業者對新聞事件進行深入的分析,準確把握事件背后的原因和影響因素。(5)通過分析新聞素材的特定要素,發現具有新聞價值的信息,包括熱點話題、社會熱議、人物故事等,對新聞報道的創新和發展有著積極的作用。(6)降低出錯率。由于新聞素材挖掘技術可以快速地對大量信息進行篩選和分類,從而減少新聞從業者的疏漏并降低其出錯率。
2.信息化時代新聞素材挖掘技術的關鍵技術
2.1" "新聞素材的預處理技術
在信息化時代背景下,傳統的新聞信息采集模式已經逐漸無法滿足新聞行業發展的需要。因此,要提升新聞采集質量和效率,就需要應用相關的新聞素材挖掘技術,對新聞信息進行預處理。預處理技術是指在信息采集之前對所需要的信息進行數據轉換、數據壓縮以及數據抽取等操作。[3]這一過程,主要是通過對采集到的大量數據信息進行整理和篩選,形成一個符合用戶需求的數據集合。預處理技術的應用不僅可以提升新聞素材挖掘質量和效率,同時也能夠提升新聞采集的質量和效率。此外,通過對大量數據信息進行有效的預處理,還能保證所獲得信息的全面性和準確性,為后續新聞素材挖掘工作提供堅實的基礎。
2.2" "關鍵詞提取技術
在傳統新聞的采集過程中,需要大量的人力采集新聞信息,會出現大量的人工編輯、整理工作。這樣不僅會耗費大量的時間,同時還會導致新聞內容存在較大的重復性。隨著信息技術和新聞行業的不斷發展,需要采集的新聞素材量也逐漸增多。對這些大體量的素材來說往往很難找到準確的關鍵詞,導致無法將相關信息有效地提取出來。現在利用關鍵詞提取技術則可以幫助工作人員快速獲取到所需要的信息,同時還可以保證相關信息的完整性和準確性,為后續工作的開展奠定良好的基礎。
關鍵詞提取技術是通過相關軟件自動抽取所需新聞內的關鍵詞,并將這些關鍵詞與新聞素材相匹配,從而完成對相關新聞的自動篩選。[4]關鍵詞提取技術主要包含關鍵詞檢測系統、信息管理系統等多個方面的內容。關鍵詞檢測系統主要是通過計算機軟件對所需要獲取的新聞素材進行自動檢測,并通過計算機軟件對這些新聞素材進行分類,與數據庫中的相關信息進行匹配,從數據庫中獲取到所需要的信息。信息管理系統是通過計算機軟件來存儲、管理和控制相關數據,將所需要獲取的數據和新聞素材進行自動分類整理。
總的來說,關鍵詞提取技術可以有效提高新聞信息檢索、新聞內容發現等多方面的效率和質量,對新聞素材的挖掘和新聞采編工作具有積極意義。
2.3" "文本分類技術
在挖掘新聞素材時,需要對采集到的信息進行預處理,從采集到的原始數據中提取信息,對信息進行分類,在分類的過程中,需要使用到文本分類技術。
文本分類技術是將采集到的信息進行初步歸類,將信息按照一定的標準劃分為不同的類別。文本分類技術是目前新聞素材挖掘工作中應用較為廣泛的一項技術。在使用過程中需要注意兩點:一是需要確保分類信息沒有重復;二是需要確保所劃分出的類別具有較高的準確性。
2.4" "情感分析技術
情感分析技術主要是通過提取新聞中所包含的情感信息,再通過情感分析技術對這些情感信息進行進一步的篩選,為新聞工作者提供有價值的新聞素材。
在應用情感分析技術時,要對文本進行預處理,主要是利用分詞系統對文本信息進行去噪處理和分詞處理,使其可以被計算機識別。在對文本信息進行預處理時,應該遵循一定的原則。首先確保所提取的情感信息是真實存在的情感,其次應確保所提取出來的情感信息是沒有經過修改或者篡改過的情感信息。[5]在這一過程中需要注意不能提取與新聞事件無關或者與新聞事件相關度不高的情感信息。
情感分析技術在新聞素材挖掘中有著廣泛的應用,主要體現在:(1)輿情分析:識別和分類新聞素材中的情感傾向,通過對情感極性的判斷和分析,對新聞事件的輿情進行監測和評估,幫助媒體了解公眾對事件的態度和情感傾向。(2)事件檢測與跟蹤:幫助自動發現和跟蹤新聞素材中的事件,并判斷該事件從事者的情感傾向。[6]通過監測和分析事件相關的情感信息,能更好地了解事件的發展趨勢和關鍵點。(3)新聞推薦:根據用戶的興趣和情感偏好,智能推薦新聞素材,從而提高用戶的閱讀體驗。例如,對積極情感偏好的用戶,系統可以推薦一些正面的、鼓舞人心的新聞素材。(4)品牌監測:對品牌相關的新聞素材進行自動分析和監測,了解公眾對品牌的情感傾向和態度,并且識別出可能對品牌形象產生負面影響的信息,幫助企業及時做出應對措施。
2.5" "基于知識圖譜的新聞素材挖掘技術
隨著互聯網技術和大數據技術等相關信息技術的不斷發展,知識圖譜在當前社會各個行業和領域中都得到了較為廣泛的應用。知識圖譜是指在一定的領域中,梳理和展示實體以及實體之間的關系,并對實體之間所具有的特征進行描述,最終使這些實體之間形成一個互相聯系的網絡。知識圖譜中包含的信息都是真實有效的,并且與現實生活存在一定的聯系,具有較強的實用性。[7]
基于知識圖譜的新聞素材挖掘技術,是一種基于大數據和人工智能技術的新聞素材處理方法。它利用自然語言處理、機器學習、圖譜構建等技術,將新聞素材中的信息進行提取和分析,并將這些信息組織成為一張知識圖譜,實現對新聞事件的深度挖掘和理解。
基于知識圖譜的新聞素材挖掘技術主要有以下幾個特點:(1)知識圖譜構建:基于知識圖譜的新聞素材挖掘技術,通過構建一個海量的知識圖譜,將新聞素材中的各類信息進行關聯和整合,從而實現對新聞事件的知識獲取和理解。(2) 語義分析:該技術利用自然語言處理技術,對新聞素材進行分析和處理,實現對文本中的語義信息的提取和理解,同時也能夠識別出文本中的情感和態度。(3) 事件發現:基于知識圖譜的新聞素材挖掘技術能夠自動發現新聞素材中的事件和話題,并對相關信息進行分類和整合,從而實現對事件的深度挖掘和理解。(4) 智能推薦:該技術能夠根據用戶的興趣和需求,自動推薦相關的新聞素材和事件,從而提高用戶的信息獲取效率。
基于知識圖譜的新聞素材挖掘技術,將會在未來的新聞素材處理領域中具有廣泛的應用前景,為新聞媒體和用戶提供更加豐富、準確和深度的信息服務。
3.新聞素材挖掘技術在新聞采寫中的應用
3.1" 新聞信息獲取:通過新聞素材挖掘技術更快捷、準確地獲取消息來源
在信息化時代,人們獲取新聞素材的方式更加多樣化,除了傳統的搜索引擎,人們還可以通過社交媒體和網絡論壇來獲取信息。對新聞工作者來說,可以通過新聞素材挖掘技術,更快捷、準確地獲取消息來源。
第一,可以通過新聞搜索引擎來獲取信息。新聞搜索引擎是一種以新聞為主要檢索對象的搜索引擎,通過對網絡上廣泛存在的新聞信息進行采集、整理和分類,提供給用戶一個高效、準確的新聞檢索工具。[8]例如谷歌新聞、百度新聞等,可以根據新聞的關鍵詞、時間、地點、來源等多種方式進行檢索。新聞搜索引擎不僅能夠提供較為全面的新聞信息,而且搜索速度非常快。第二,社交媒體是一種基于用戶生成內容的平臺,它是獲取實時新聞的重要渠道之一。例如推特、微博等,這些平臺上的用戶可以隨時發布新聞、評論、照片、視頻等內容,可在其中尋找有價值的新聞信息。通過關注新聞領域中的專家、媒體機構和記者,獲得更加深入、全面和及時的新聞信息。第三,數據庫檢索。新聞數據庫是一種專門存儲新聞信息的數據庫,其中包括歷史性的新聞事件及最新的新聞報道。利用數據庫檢索技術,可以根據關鍵詞、時間、地點、媒體等多種屬性進行檢索,獲取具有一定權威性的新聞信息。第四,可以通過RSS訂閱。RSS是一種網上內容分發技術,它提供一種簡單的方式來訂閱新聞、博客和其他網站的更新。通過RSS訂閱,用戶可以選擇自己感興趣的新聞來源,每當發布新內容時,就會發送通知給用戶。這對于經常需要查詢某些新聞的人來說非常方便,同時也能夠保證獲取到最新的新聞信息。
通過以上四種方法,可以在短時間內獲取到大量的新聞信息,通過新聞素材挖掘技術的幫助,進一步篩選、分類、分析這些信息,為新聞報道提供更加準確、全面、深入的素材。
3.2" 新聞素材處理:通過新聞素材挖掘技術處理大量文本、篩選,提取出有價值信息
在大數據時代背景下,新聞采寫工作人員要深入研究大數據技術。由于互聯網上信息量較大,且內容繁雜、分散。所以在進行數據信息處理時要充分利用數據挖掘技術對數據信息進行篩選、整理、整合等操作。
首先需要對采集到的新聞文本進行清洗,去除無用的字符、符號、標點等,并做好格式規范化,以便后續處理。接著,采用自然語言處理技術,將新聞文本進行分詞,即將連續的文本劃分成一個一個單獨的詞語,以便后續處理;通過自然語言處理技術(如TF-IDF算法、TextRank算法等),從分詞后的文本中提取出關鍵詞,以便后續分析和挖掘;通過主題分析或話題模型技術,對新聞文本進行分類,將其歸入不同的主題或話題中,便于后續處理;利用機器學習等技術,對新聞文本中的情感進行判斷和分類,識別出積極、消極或中性的情感傾向;通過命名實體識別技術,識別出新聞文本中的人物、地點、機構等實體,便于后續分析;通過關系提取技術,識別出新聞文本中不同實體之間的關聯關系,便于后續分析。另外,在進行文本數據處理時,要根據不同的需求對其進行分類和篩選。如通過關鍵詞過濾、文本聚類等方式來快速、準確地篩選出相關信息。
3.3" 媒體監測:通過新聞素材挖掘技術監測媒體平臺上的新聞信息,把握事件脈搏
新聞素材挖掘技術需要用到一個非常龐大的數據庫,包含了大量的新聞素材。在實際工作中,編輯要合理利用新聞素材挖掘技術,要對媒體平臺上發布的新聞進行全面監測,在此基礎上結合自身經驗對相關信息進行整理和分析,為后續的寫作提供必要的資料和素材。
首先,通過對大量新聞文本進行挖掘和分析,實時監測和跟蹤某一事件的發展情況,了解事件的起因、過程、結果等,以及與事件相關的各種信息,如主要參與者、時間、地點、背景等。這可以幫助新聞工作者及時了解事件的進展,從而更好地做出決策和行動。其次,通過分析新聞中的情感傾向、態度和評價等信息,可以進行輿情分析和監測。[9]例如,可以分析某一品牌或公眾人物的聲譽和形象在社會中的影響,及時發現和解決公眾關注度高、評價多的問題。最后,通過對各大媒體平臺的新聞報道進行監測,了解不同媒體之間的關注焦點、報道角度、數據來源等,以及對某個事件的態度和立場等。這可以幫助企業或公眾人物更好地了解媒體的運作規律和特點,制定相應的傳播策略,提升公眾認知度和形象。
3.4" 輿情分析:通過新聞素材挖掘技術分析公眾的情感和反應,把握社會輿論態勢
大數據時代下,新聞素材挖掘技術不僅能幫助編輯對新聞事件進行深入分析,還能對公眾的情感和反應進行分析,進而幫助編輯更好地把握社會輿論態勢。具體而言,新聞素材挖掘技術的應用可對公眾的情感和反應進行分析,根據不同新聞事件中公眾的情感和反應不同,進而對其進行分析、總結和歸納。例如,在日常生活中,當人們遇到一些令人感到沮喪或者感到氣憤的事件時,他們會有各種不同的情感表現。在這種情況下,新聞采寫人員可以利用新聞素材挖掘技術對公眾的情感進行分析、總結和歸納。同時,在實際新聞采寫過程中,新聞采寫人員要掌握一定的分析技巧和方法,并不斷學習和探索各種分析技巧和方法,更好地挖掘公眾情感和反應。
3.5" 事件報道:利用新聞素材挖掘技術收集、整理和分析事件信息,鎖定更有深度、廣度的報道素材
在大數據時代,數據是新聞事件的重要來源,具有一定的權威性。通過對數據的搜集、整理和分析,可以發現事件背后的隱性信息,為編輯提供更有深度和廣度的報道素材。
首先,利用大數據技術對新聞事件進行搜集,可以發現事件中存在的隱性信息。[10]如對事件中人員的年齡、性別等進行統計分析,發現該事件發生的特殊群體。此外,還可以分析該事件發生時出現的時間、地點等信息,以更好地理解事件發生背后所存在的意義和價值。其次,利用大數據技術對新聞事件進行整理和分析,發現該事件在社會中引起的反響,以及人們對這一問題的看法。通過對事件本身進行深度挖掘,發現該新聞事件產生的原因,以及該問題在社會上引起巨大反響后人們對其態度等信息。通過分析這些數據信息可以為編輯提供更有深度、廣度和高度的報道素材,使編輯能夠更好地把握社會發展趨勢。
4.信息化時代新聞素材挖掘技術的發展趨勢與未來展望
隨著信息技術的不斷發展,新聞行業的發展不僅對當前社會具有很大的影響,同時也對我國未來的發展具有積極的促進作用。因此,在當前社會中,新聞行業為了能夠更好地適應社會的發展需求,需要不斷地創新新聞素材挖掘技術,不斷提高新聞行業中所應用到的技術水平。
隨著大數據時代的到來,信息數據呈現出爆炸式增長,新聞素材挖掘技術將這些海量的數據進行分析和篩選,為新聞媒體提供更加準確、全面和豐富的新聞素材。該技術最大的創新點是能夠根據用戶的需求進行大數據分析,并對用戶的瀏覽行為、收藏內容、行為軌跡等進行綜合分析,為用戶提供個性化服務。在未來發展中可以應用于更多領域,例如城市建設、交通運輸等領域,將其與人們的生活相結合,使人們獲得更加方便快捷的服務。
參考文獻
[1]劉紹琴.廣播電視新聞編輯技巧及提升策略[J].中國報業,2022(10):104-105.
[2]張建華.互聯網背景下新聞素材的深度開發和改良探析[J].中國地市報人,2021(9):34-36.
[3]唐雪蓮.融媒體視閾下電視新聞素材的整理與編輯[J].采寫編,2021(5):44-45.
[4]李軒冰. 基于文本挖掘技術的網絡熱點新聞系統的研建[D].北京:北京林業大學,2020.
[5]孟偉.新媒體時代信息傳播方式研究解析[J].環球首映,2019(7):155.
[6]李心舒. 基于Spark的多領域網絡新聞熱點挖掘技術研究與實現[D].北京:北京郵電大學,2019.
[7]馮霞. 面向網絡新聞的熱點話題挖掘技術研究[D].南京:南京理工大學,2019.
[8]鐘智錦,王童辰.大數據文本挖掘技術在新聞傳播學科的應用[J].當代傳播,2018(5):12-18.
[9]羅政.TRS網絡輿情和社會媒體挖掘服務平臺[J].中國傳媒科技,2011(8):54-56.
[10]尚恩潔.沒落“貴族”《東方時空》的機遇——淺談電視新聞雜志利用數據挖掘技術發展[J].新聞研究導刊,2015(14):237+240.
作者簡介:李云霞(1975-),女,河北張家口,編輯,研究方向為新聞采編;李偉(1983-),男,河北張家口,助理編輯,研究方向為新聞采編。
(責任編輯:張曉婧)