999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

機器寫作在氣象融媒體服務中的應用研究

2022-01-07 12:52:14胡小羽
電視技術 2021年11期
關鍵詞:內容產品服務

胡小羽,孫 通,胡 康,王 磊

(1.江西省氣象服務中心,江西 南昌 330000;2.深圳市國家氣候觀象臺,廣東 深圳 518040)

0 引言

隨著技術的發展,新型媒體平臺不斷增多,大眾獲取氣象信息的渠道趨于多樣化,傳統公眾氣象服務方式難以滿足日漸增長的公眾服務廣度和深度要求,融媒體氣象服務成為當前主流的發展方向。面對多平臺、多需求、多數量的新要求,融媒體氣象服務產品在產出速度和數量上都面臨新的挑戰,依靠人力很難快速形成產品的海量輸出。機器寫作的引入可以實現氣象數據自動生成圖文和音視頻產品,有利于彌補氣象融媒體服務人力產能不足的短板。

1 機器寫作技術的應用現狀

機器寫作指的是運用算法收集、處理數據并自動生成稿件的計算機程序。理想情況下,寫作機器人可以脫離人力干涉,自動且快速地生成各種題材的文字稿件,包括并不限于新聞資訊、服務說明、詩歌文學、文字腳本等內容,且能夠不斷學習、自我迭代,從而達成輔助或代替人類寫作的目的[1]。

目前,機器寫作技術已經從理論逐步走向實踐,在國內外多個領域,尤其是傳媒領域獲得了較為廣泛的應用。國外已經使用機器寫作的媒體有紐約時報(blossom)、美聯社(WordSmith)、華盛頓郵報(Heliograf)等,國內有新華社(快筆小新)、騰訊(dreamwriter)、今日頭條(張小明)、南方都市報(小南)等,寫作內容以財經、體育、科技新聞以及每日熱點資訊為主。

隨著機器深度學習領域的拓寬,部分新聞寫作機器人涉及了部分天氣資訊的寫作,主要以天氣災害和天氣新聞播報為主,但還存在兩點不足:一方面,主流產品以抓取相關網絡數據為主,在氣象數據上的可選范圍小,難以進行更復雜和詳細的天氣描述,同質化程度高;另一方面,產品主要以文本為主,基本沒有常規運行的音視頻產品,難以適應當前的融媒體環境,大眾覆蓋面較窄[2]。

想要更好地利用氣象數據,實現多種形式產品的生產,就要用機器寫作技術實現“氣象數據-文本”,并以此為基礎,引入當下成熟的文字轉語音技術以及氣象數據可視化技術,最終以氣象數據為基礎,自動快速形成氣象融媒體產品。

2 氣象融媒體機器寫作的制作模式

機器寫作技術模仿或代替人類工作,本質上是一種自然語言處理系統(Natural Language Processing,NLP),根據不同的數據來源和產出需求,發展出了模板式、抽取式及生成式3 種模式。

2.1 抽取式機器寫作

抽取式機器人會對文本進行語義分析,識別冗余信息,抽取重要內容,通過摘錄或概括的方法壓縮文本,形成對于既定文字的摘要,再加以計算確保文摘的連續性,這種技術廣泛應用于新聞內容概括和文摘生成[3]。

在氣象融媒體服務當中,抽取式機器寫作可以以新聞綜述和信息匯總的生成方式,通過抓取已經存在的相關服務信息和新聞,對某種災害性天氣服務進行匯總型整理,尤其是對于已經結束的天氣過程,讓大眾有更加全面的認識。但由于氣象實況和預報主要以數據為主,該方式難以表達天氣預報及相關服務。

2.2 模板式機器寫作

模板式寫稿機器人主要通過優化算法,在預先存儲的大量寫作模板中,選擇與給定材料相匹配的模板,將信息加以組合生成文本,是目前應用最成熟、實現最容易的一種機器寫作方法,但生成的內容相對固定化。

模板式機器寫作可以較好地形成氣象融媒體服務“數據-文本”的流程,為了規避模板固定化、內容同質化的弊端,可通過加設氣象數據條件判定,即以氣象服務內容特征為依據,設置數據呈現的觸發機制,篩選當天最為突出的實況內容和預報特征,在文字用語、圖片配色上做差異化分類,能夠在一定程度上規避產品的大量同質化問題[4]。

2.3 生成式機器寫作

生成式主要通過深度學習和增強學習技術實現。機器通過大量的文學作品樣本進行訓練,學習各類寫作風格、建立寫作模型,再根據輸入的文字片段獲知任務需求,預測并生成與需求相匹配的文稿,進行輸出。

在理想情況下,生成式機器寫作是比較好的解決方案,能夠通過深度學習,不斷自我迭代,但在實際操作過程中還面臨大量技術挑戰,如樣本的補充難度、模型訓練的復雜度、同義詞的問題、情感傾向問題、歧義性問題等等,因此距離實際生產應用還有不小的距離。

筆者認為,基于氣象數據量大的特性,以及重預報、重防范的服務特性,模板式機器寫作可以更好地側重于天氣過程的發生發展,可以作為主要的機器寫作方式,從而實現數據驅動、自動生產文本的快速流程,并通過數據判定、模板更新、更替圖片配色等方式,彌補內容同質化缺陷,發揮特長。

3 氣象融媒體機器寫作的實現方法

3.1 整體架構

氣象數據自動生產氣象融媒體產品的實現需要4 個模塊,即數據管理模塊、文稿生成模塊、語音合成模塊以及視頻合成模塊,如圖1 所示。數據管理模塊讀取和保存氣象實況和預報數據,文稿生成模塊主要完成將氣象數據轉化為文本的工作,語音合成模塊采用外鏈文字轉音頻技術,形成音頻產品,視頻合成模塊將選用的氣象數據生成圖片,最終結合音頻產品輸出成視頻。通過各個模塊的寫作,可以實現氣象數據對文字、音頻、圖片和視頻的自動生成,由一組數據形成整套多樣態的氣象融媒體服務產品[5]。

圖1 氣象融媒體機器智能寫作結構

機器寫作技術主要應用在文稿生成模塊,該模塊是整個體系的基礎和核心,基于模板式機器寫作方式,該部分主要通過文稿模板素材庫和數據觸發規則來實現,當氣象實況和預報數據滿足觸發條件,則對該組數據進行模板文字匹配。

3.2 機器寫作文稿生成

機器寫作文稿生成部分的主要內容由兩大部分組成,一是數據觸發規則,二是文字模板素材。基于氣象數據的特性和大眾對氣象服務的主要需求,需要分別對兩者進行細致的設定。

3.2.1 數據觸發規則

數據觸發規則需要判斷是否觸發描述該天氣,以及如何有區分、有輕重地描述此類天氣。氣象數據包含氣象實況數據和預報數據,氣象實況數據具有氣象要素、時間、不同量級定義、地理位置等復雜信息,每個時段所有站點擁有的全要素氣象實況數據,信息量大且龐雜,需要從大量的信息中篩選出對大眾生活有影響的天氣要素,有重點地進行描述。預報數據包含時間、天氣、區域等信息,同樣也需要從面到點的概括式、聚焦式說明。

數據選取規則需要根據不同氣象要素分類設定,一條規則需要包含規則的id、觸發優先級、規則內容以及觸發動作等信息,可以讓大眾更加明確天氣的強度。比如氣溫要素,需要配置“如果文本生成時間>08 時且<14 時,且未觸發最低氣溫數據,那么就使用08 時氣溫全省平均值”。而如果是降雨,則需要配置“10 mm 以上站點占10%~30%,觸發最近24 h 累計雨量,使用降雨站點數量以及主要量級。當最高量級為大雨以上時(≥25 mm),還需調取最高量級站點數量、最高值站點名稱及其數值。”

地理分布規則,主要為了更加明確地歸納天氣發生發展的地理位置,并使用約定俗成的區域劃分方式。以江西省為例,可以劃分為贛北、贛中、贛南等區域,大眾可以更加直觀地認知該天氣的覆蓋面。

3.2.2 模板語料庫

根據細分的判定規則,需要對每一種天氣要素的不同強度分類進行細致的模板文字梳理,比如對于高溫,當全省日最高氣溫滿足“30 ℃<全省最高氣溫平均值(c)<35 ℃”這一條件時,在文字內容的分類上考慮使用一般表達強度,簡單描述現狀。“昨天全省最高氣溫平均有(c)℃。”而當日最高氣溫滿足“30 ℃<全省最高氣溫平均值(c)<35 ℃,且30%以上站點數值≥35 ℃”時,文字部分需要體現熱的強度升級,如“昨天,全省熱浪席卷,日最高氣溫平均有(c)℃,(c2)個縣區出現了35 ℃以上的高溫,其中(c3)最為炎熱,高(c4)℃。”

同時,針對不同天氣對大眾生活影響的方向不同,需要有側重的服務關照提示。比如“氣溫波動大,需要關注氣溫變化,合理調整著裝”“氣溫偏高,午后雷雨多發,大家出門的時候記得備一把雨傘,防曬防雨兩不誤”。不僅呼應和總結了未來天氣變化的重點,同時還在一定程度上體現了人文關懷,使文稿更具有“人味”。

根據觸發的規則,機器會選取合適的模板作為輸入,生成數據替換后的最終語句。同一個觸發規則有可能對應多個文稿模板,此時可以對文稿模板定義優先級或者采用隨機、輪詢的方式選擇。

3.2.3 音視頻產品生成

音視頻產品的生成主要通過引入成熟的相關轉換技術來實現。在機器寫作完成數據篩選和文本生成后,音頻產品將會由文字直接轉換而來,視頻的畫面部分可以通過對觸發數據的氣象數據可視化技術實現,經過規則匹配之后,系統篩選出使用的數據種類和時次。根據這些信息,在素材庫中搜索對應的可視化圖片產品。這些圖片產品會作為素材,替換After Effects 模板中的資源,然后進行渲染,最終生成視頻。

4 應用前景及缺陷

4.1 應用前景

以機器寫作技術為基礎,引入音頻和數據可視化技術,可以很好地解決氣象融媒體產品在短時間、大批量、全平臺、多樣態覆蓋的難題,能夠在一定程度上解放服務人力。主要有以下優勢。

(1)數量多,極大豐富常規的氣象融媒體產品數量,實現多平臺、多時次的氣象融媒體產品投放,節約服務人力,可以讓公眾氣象服務人員投入在創造性內容以及重大氣象災害的相關服務產品上。

(2)速度快,在突發氣象災害,尤其是短時強對流天氣等生命史短暫、影響區域狹小、時空分布復雜的天氣過程時,利用機器寫作,可以快速制作并發送服務產品,特別是可補充融媒體產品制作欠缺的縣區一級。

(3)性價比高,一次投入多次使用。由于氣象內容的數據轉產品的特性,只要形成多樣化的邏輯模板、不斷抓取語料庫,后期輔助人工審核即可,可減少大量人力成本和從業人員的教育時間成本。

4.2 不足及思考

氣象融媒體機器寫作的應用能在一定程度上緩解目前氣象融媒體產品的產能不足和供需矛盾,但同樣面臨著一些風險,具體如下。

(1)內容同質化風險。快速、大量的模板內容出現,使得相關內容同質化現象明顯,很容易帶來審美疲勞,導致關注度流失,應當更多頻次地更新語言模板和產品樣態。在重大氣象服務中,更多專業且精細化的融媒體服務產品,還需更多的專業服務人員的參與。

(2)海量資訊重點模糊。當大量機器生產的融媒體產品投放時,信息呈現爆炸性的增長,容易使得真正重要的內容無法更好地傳達到大眾面前。因此,在使用和投放中應當更加慎重,尤其是面對氣象災害時,需要更加規律且克制地使用相關技術。

(3)內容導向風險。對于災害性天氣的描述很可能流于數據而缺乏人文關懷,對于災害的用詞的準確性,是否符合災情中的情感傾向,需要人工把握和審核。

5 結語

機器寫作在氣象融媒體服務中的應用具有較好的技術可行性和良好的使用前景,該技術的使用將極大地豐富氣象融媒體產品的數量和更新頻次,但應將人機關系定位在協同服務的位置上,補充人力不足,輔助人工服務,形成差異化分工合作,而絕不是代替人工。機器寫作需要不斷由人工審核、審慎投放、更新模板,才能避免內容同質化、模糊焦點和內容導向的風險,更好地為大眾提供氣象服務產品。

猜你喜歡
內容產品服務
內容回顧溫故知新
科學大眾(2022年11期)2022-06-21 09:20:52
服務在身邊 健康每一天
今日農業(2019年12期)2019-08-15 00:56:32
服務在身邊 健康每一天
今日農業(2019年10期)2019-01-04 04:28:15
服務在身邊 健康每一天
今日農業(2019年16期)2019-01-03 11:39:20
招行30年:從“滿意服務”到“感動服務”
商周刊(2017年9期)2017-08-22 02:57:56
主要內容
臺聲(2016年2期)2016-09-16 01:06:53
2015產品LOOKBOOK直擊
Coco薇(2015年1期)2015-08-13 02:23:50
新產品
玩具(2009年10期)2009-11-04 02:33:14
產品
個人電腦(2009年9期)2009-09-14 03:18:46
下一個酷產品是什么
舒適廣告(2008年9期)2008-09-22 10:02:48
主站蜘蛛池模板: 91青青草视频在线观看的| 精品国产黑色丝袜高跟鞋| 在线观看国产精品第一区免费| 国产在线拍偷自揄拍精品| 四虎永久在线精品影院| 无码在线激情片| 国产在线精品人成导航| 成年女人a毛片免费视频| 欧美综合中文字幕久久| 亚洲欧洲一区二区三区| 国产网站黄| 国产亚洲一区二区三区在线| 婷婷亚洲综合五月天在线| 在线观看视频99| 国产精品林美惠子在线观看| 一级福利视频| 免费a级毛片18以上观看精品| 不卡无码网| 国内自拍久第一页| 四虎影视8848永久精品| 日韩一区二区三免费高清| 国产成人亚洲欧美激情| 黄色福利在线| 日韩av无码DVD| 国内黄色精品| 久久综合干| 亚洲欧美日韩高清综合678| 免费在线不卡视频| 人妻免费无码不卡视频| 国产午夜不卡| 人妻精品久久久无码区色视| 一本大道AV人久久综合| 色综合天天综合| 亚洲视频在线观看免费视频| 99视频精品在线观看| 为你提供最新久久精品久久综合| 伊人久久婷婷| 三上悠亚一区二区| 国产在线一区视频| 久久精品国产91久久综合麻豆自制| 欧美日韩在线国产| 国产欧美日韩91| 婷婷亚洲视频| 91偷拍一区| 天堂网亚洲系列亚洲系列| 五月天久久综合| 91麻豆国产视频| a级毛片视频免费观看| 激情五月婷婷综合网| 99久久成人国产精品免费| 日韩国产一区二区三区无码| 色丁丁毛片在线观看| 韩日午夜在线资源一区二区| 怡红院美国分院一区二区| 久久久噜噜噜| 久久精品中文字幕免费| 国产精品第页| 国内精自视频品线一二区| www.99精品视频在线播放| 色噜噜久久| 国产制服丝袜无码视频| 欧美视频在线播放观看免费福利资源 | 亚洲最大综合网| 欧美在线观看不卡| 亚洲综合极品香蕉久久网| 亚洲人成影院在线观看| 国产综合网站| 幺女国产一级毛片| 9966国产精品视频| 在线观看免费人成视频色快速| 国产精品开放后亚洲| 亚洲欧美国产高清va在线播放| 国产aⅴ无码专区亚洲av综合网| 日韩二区三区无| 毛片a级毛片免费观看免下载| 一本一道波多野结衣av黑人在线| 亚洲va欧美va国产综合下载| 视频一区亚洲| 伊人查蕉在线观看国产精品| 午夜电影在线观看国产1区| 手机永久AV在线播放| 久久久久国产一区二区|