□ 劉海蘭 李海彬 羅一宇
新聞核心稿件數據的綜合應用經驗與技術探討
□ 劉海蘭 李海彬 羅一宇
筆者結合自己多年的文稿數據庫開發應用經驗,介紹在現有技術條件下,如何通過數據分析和挖掘,使新聞稿件數據得到有效利用和發揮更大的效能,并通過實際案例進行了說明。
文稿系統;數據挖掘;互聯網應用;WebService接口
廣西電視臺新聞中心文稿處理系統存儲的稿件跨度從1996年至2016年,全部新聞稿件量累計近200萬條。在大數據時代,數據的重要性不言而喻,怎樣通過技術手段將它們有效利用起來,發揮更大的效能,是新聞技術人員需要思考和解決的問題。
大部分電視臺的文稿處理系統一般只提供記者寫稿、編輯選稿、領導審稿、稿件查詢等與節目稿件制作相關的功能,而新聞中心的文稿處理系統除了前面提到的這些基本功能外,仍在不斷地針對這個系統進行升級和擴展。圍繞各個稿件庫的可用字段進行充分挖掘,在盡量不增加采編人員工作量的情況下,利用原有數據加入了一些實用的功能模塊:
打分和工分統計:值班主任在每檔新聞節目錄播完成后,在節目串編單中給每條片子打分,月末統計各記者當月播發稿件量和總分,作為量化獎金的依據。
通訊員稿件管理:在錄用稿件時,“錄稿”存儲過程檢測稿件是否有外單位通訊員參與,如有則導出一份稿件到“通訊員稿費庫”,并根據通訊員名字對應到“通訊員信息庫”,調取他的單位、通訊地址、銀行賬號等信息,自動生成稿費發放清單。
傳央視稿件管理:由外聯人員從各個新聞稿件庫中,選擇央視可能需要的稿件,并導出一份稿件到“預送央視稿件庫”,之后結合視頻上傳央視供稿平臺,在央視錄用后標注在哪個欄目播出。這個稿件庫為記者提供查詢、統計功能,使他們知道自己的片子是否被央視錄用,年度統計結果也作為評測工作量和獎勵的依據。
短信收發管理:通過“內部通訊錄庫”里的姓名和手機號碼,可以在系統中直接向指定人員發送手機短信;記者可以將新聞稿件通過短信發回文稿系統數據庫,并直接對應到記者稿件庫(根據手機號碼綁定)。
通過對文稿原始數據進行的內容分析和關聯性分析,尋找隱藏在數據中的知識,挖掘其價值,再輔以技術手段進行合理利用,可以實現系統功能的擴展。
在針對新聞稿件的互聯網應用方面,目前我們建立了兩個網站系統,均采用B/S結構、C#開發,運行在支持動態網頁和網頁局部刷新技術的ASP.NET 2.0平臺。根據它們面向的對象群體和使用功能的不同,采用的技術方案也有所區別。
(一)遠程文稿系統
遠程文稿系統的使用人員是新聞中心本部門的工作人員,以及一些地市臺的通訊員,不對公眾開放。它是局域網文稿處理系統在互聯網的延伸,自身不帶數據庫,在網頁中呈現的內容源自內部的文稿數據庫,稿件數據是實時的,如圖1。

圖1
遠程文稿系統在網絡安全防護上,使用硬件防火墻,只開放WWW端口,定期對服務器打補丁。另外,除了賬號密碼進行登錄身份認證外,我們還多加了一級安全防護:手機短信驗證。在完成身份認證后,系統調取認證用戶在“內部通訊錄”中存儲的手機號,并向這個手機號發送6位數字的隨機驗證碼。
通過遠程文稿系統,記者、地市臺通訊員可以方便地在外地將稿件傳回新聞中心總部,并可以通過系統查詢所需的新聞資料,明顯提升了新聞工作效率。
(二)已播稿件查詢系統
這個系統的應用群體是同行業的新聞工作者,如地市臺的同行、各廳局單位特約記者站的通訊員。與遠程文稿系統不同,已播稿件查詢系統的網頁內容雖然也源自新聞文稿數據庫,但并不是實時獲取的,并且只能查看新聞中心各欄目已播發新聞的文字內容,如圖2。我們開發了一個自動定時更新軟件,根據設定的時間(凌晨2∶00),自動從文稿數據庫的“播出總庫表”將當天播發的稿件資料推送到已播稿件查詢系統的本地數據庫中。

圖2
已播稿件查詢系統可以讓合作單位的通訊員查詢我臺新聞播發稿件,便于他們收集整理新聞資料,統計本單位提供新聞數據量,制作年度報表。
在高清數字電視的時代,非編網絡化制播系統開始取代原來的磁帶機對編,而非編網絡化制播系統通常都與文稿系統配合使用,但是非編廠商配套提供的文稿系統卻不一定滿足新聞工作的需要,主要有三方面的問題:工作流程問題、功能問題、使用習慣問題。
在不使用非編廠商配套文稿的情況下,可以通過接口實現文稿系統與非編網的融合,在與第三方系統對接時,Web Service是最常用的技術。
Web Service是一種構建應用程序的普遍模型,可以在任何支持網絡通信的操作系統中實施運行。Web Service是一個應用組件,它極具邏輯性地為其他應用程序提供數據與服務。在構建和使用Web Service時,主要用到以下幾個關鍵的技術和規則:1.XML:描述數據的標準方法;2.SOAP:表示信息交換的協議;3.WSDL:Web服務描述語言;4.UDDI(Universal Description,Discovery and Integration):通用描述、發現與集成,它是一種獨立于平臺的,基于XML語言的用于在互聯網上描述商務的協議。
下面分別介紹新聞中心的文稿系統與北京捷成的蘋果高清非編制播系統、與北京大洋的高清非編制播系統通過Web Servicer技術進行對接的融合方案。
(一)與捷成高清蘋果非編制播系統融合方案
圖3是新聞中心文稿處理系統與捷成蘋果非編制播系統對接的業務流程圖。

圖3
由于蘋果非編軟件運行平臺為MAC操作系統,所以方案中采用的是雙文稿系統方案,雙方各有一套自己的文稿系統(以下簡稱“捷成文稿”和“新聞文稿”),通過雙方開發的Web Service接口進行數據同步、消息收發。雙方約定的工作流程如下:
1.新建稿件和非編項目。記者登錄蘋果非編工作站,通過“捷成文稿”新建一個Final cut項目,同時錄入稿件。2.記者提交稿件和半成品。記者使用Final cut粗編,完成后在“捷成文稿”中提交,捷成后臺調度系統調用Finalcut完成素材打包,同時調用“新聞文稿”的Web Service接口向其發送稿件。3.串聯單稿件同步。欄目責編在“新聞文稿”中瀏覽記者原稿并根據欄目需要選用,之后各級審稿流程在“新聞文稿”走完。稿件至串聯單稿件庫后,“新聞文稿”調用“捷成文稿”的Web Service接口,將本方串聯單稿件發送過去。4.素材精編及配音合成。后期編輯選中“捷成文稿”串聯單的某條稿件,啟動蘋果非編軟件Finalcut,打開與稿件對應的記者素材進行精編、過字幕,之后由播音員在非編網內完成配音。5.領導審片、送播。領導在蘋果工作站中觀看完成的節目視頻,審核通過后,提交送至播出服務器待播。
(二)與大洋高清非編制播系統融合方案
在與大洋非編制播系統進行對接的方案中,僅使用新聞中心原有的文稿處理系統,主要原因是大洋公司的非編軟件是運行在W indows平臺的,“新聞文稿”可以運行在大洋非編網中。
但相對于與捷成非編的對接方案,新聞中心決定采用全新的業務制作流程,新聞文稿與大洋非編之間的對接更為復雜,在生產制作域的每一個環節中,都分布著雙方的接口,如圖4。

圖4
根據新聞業務制作流程為對方提供接口,并制定了公用服務接口IceService及其規范。
接口采用Web Service提供服務,以約定的XML結構填充入參及返回結果,各系統向IceService發送請求,返回IceService的處理結果。IceService只擔負路由的功能,具體實現由服務插件完成。在delphi中看到的接口函數如下:
function invoke(const XmlData∶WideString)∶WideString;stdcall;
調用說明:按IceService規范將入參生成XML字符串并存儲在Xm lData變量,調用Invoke(XmlData),返回的也是IceService結構的XML字符串,之后根據MessageType進行不同的解碼,得到所需數據。
本文分享了筆者的一些經驗和做法。通過對新聞稿件數據分析和挖掘,筆者試圖在數據中找到有價值的信息,并運用技術手段將這些信息資源整合和共享,達到拓寬信息資源應用領域,實現最大化挖掘信息價值的目標。
(作者單位:廣西電視臺)