石育龍
(江蘇中江網傳媒股份有限公司,江蘇南京 210092)
傳統媒體借助內容發布系統將內容發布到報紙和傳統網站,隨著新媒體的出現,急需解決如下3個問題。
(1)急需一套中央調度、一次采集、多種生成、多元傳播(報、網、端、兩微等)新聞生產流程。
(2)服務及展現形式急需適應新媒體:需運用最新的云計算、大數據、人工智能技術實現多域性、移動化、數據化、可視化、強化H5、直播點播、移動采編、AR/VR、AI、個性化推薦等提升服務和能力。
(3)內容生產不能在單一平臺生產,而讓用戶生成內容(user generated content,UGC)。讓用戶既是網絡內容的瀏覽者,也是網絡內容的創造者,創作是網民的一種生活方式,使得平臺的內容越來越豐富,同時用戶也越來越習慣自己創作內容,并樂于與親朋好友分享自己的喜怒哀樂,還可以從自己創作的內容中獲得分成。
技術總體構架,如圖1所示。
圖1 總體技術架構
融合全媒體采編系統、融媒體系統、自媒體聚合系統、風暴大數據系統、政務系統等各類制傳系統。生產與運營以融合資源為核心,支持互聯網自媒體資源、各級內容資源整合、合作伙伴資源、各級媒體系統內容資源的聚合。提高平臺稿件來源渠道,以及提高創作參考素材。整合資源管理,和數字化管理。
業務中臺致力于業務管理、業務功能、流程定制和個性化行業定制。其作為專注提供業務解決方案中心、為媒體工作者提供“采、播、審、存”一整套流程的業務體系,提供采、制、編、審、各業務功能服務。靈活采用微服務方式提供個性化行業定制、業務流程定制。
數據中臺以數據為核心、提供標準數據采集、數據集成、數據交換、數據標注、數據分析、可視化等相關服務,創建數據倉庫中心、安全高效管理數據、合理使用數據。
微服務中心以微小顆粒化服務輸出,提供AI 智能服務、智能快編、快剪、智能排版、AI 選題策劃、AI 語義、輿情等相關智能化服務。場景方案創新定制,專業支持快速集成,打造一個可持續的智慧媒體生態。
API 與SDK 接口幫助快速接入各項能力、資源、應用、服務、業務場景、AI 智能等功能進行開放。其提供標準文檔、快速對接各機構、媒體、電臺等渠道,打造媒體數字化生態圈。
采用Spring 微服務架構搭建后臺應用對微服務來說,其運行期間也是各自獨立的。采用微服務技術的優勢體現在以下幾個方面。
(1)可擴展性:可以快速地添加服務集群的實例,提升整個微服務集群的服務能力。
(2)安全:服務隔離實際上是可擴展性的基礎,將每個微服務都隔離為獨立的運行單元后,任何一個或者多個微服務的失敗都將只影響自己或者少量其他微服務,而不會大面積地波及整個服務運行體系。
(3)效率:在微服務治理體系下,各個微服務交付期間也是各自獨立交付的,從而使得每個微服務從開發到交付整條鏈路上都是獨立進行,這大大加快了微服務的迭代和交付效率。
(4)標準化:服務的訪問者可以用的接口訪問所有這些用不同語言開發和交互的微服務,微服務的服務接口和協議。
微服務框架,如圖2所示。
圖2 微服務框架
(1)Spring Cloud Config 配置中心,利用Git 集中管理程序的配置。
(2)nacos 可以同時作為注冊中心和配置中心。
(3)Spring Cloud Sleuth 分布式鏈路監控,SpringCloud 應用的分布式追蹤系統和Zipkin、HTrace、ELK 兼容。
(4)Spring Cloud Netflix Eureka 服務中心(類似于管家的概念,需要什么直接從這里取,就可以了),是一個基于REST 的服務,用于定位服務,以實現云端中間層服務發現和故障轉移。
(5)Spring Cloud Netflix Hystrix 熔斷器,容錯管理工具,旨在通過熔斷機制控制服務和第三方庫的節點,從而對延遲和故障提供更強大的容錯能力。
(6)Spring Cloud Netflix Zuul 網關,是在云平臺上提供動態路由、監控、彈性、安全等邊緣服務的框架。Web 網站后端所有請求的前門。
(7)Spring Cloud Bus 消息總線,利用分布式消息將服務和服務實例連接在一起,用于在一個集群中傳播狀態的變化。
(8)Spring Cloud Stream 消息組件,基于Redis、Rabbit、Kafka 實現的消息微服務,簡單聲明模型用以在Spring Cloud 應用中收發消息。
通過先進的深度學習技術,將文本轉換成自然流暢的語音。有多種音色可供選擇,并提供調節語速、語調、音量等功能。移動端適用于稿件的語音交互、文稿有聲閱讀。
智能內容監審服務是一款利用語音轉寫、人臉識別、聲紋識別等人工智能技術從關鍵詞、人臉、圖片以及聲紋等不同維度對音視頻內容進行審核的軟硬件一體化服務。利用人工智能技術檢測出的不同維度信息與關鍵庫信息進行匹配,實時報警,輔助用戶工作提升監管效率。監審數據源更全面:支持本地、網絡以及直播3個不同維度的數據監審。時效性更強:自動化機器輔助,可實時推送研判結果,及時遏制有害事件發酵。有效降低成本,提高工作效率:機器自動化,1 h 數據處理僅需約10 min,效率提升約20倍。
智能內容管理平臺是一款以AI 技術為核心,實現對媒體數字資源的綜合管理的音視頻管理軟件。主要通過語音識別、NLP 等人工智能技術,解決當前音視頻管理中檢索,編目困難的問題,滿足編輯人員對音視頻內容監管、檢索、自動編目、自動化標簽的需求。其主要功能包括內容識別、內容檢索、內容審核等功能。實現對音視頻內容的自動標簽和編目,以及內容的智能檢索與審核。
智能語義理解(intelligent semantic understanding)依托深度學習、自然語言處理方向上的技術積累,為平臺提供文本相似度和機器閱讀理解等優質算法技術。其中文本相似度可以計算兩段短文本之間的相似度,并給出相似度評分;機器閱讀理解能針對某幾個問題,從若干篇文章中分別尋找問題答案。智能語義理解技術可以應用于問答系統、信息檢索、新聞推薦等場景。
智能校對服務利用前沿的自然語言處理、深度遷移學習技術,依據平臺規范、標準和業務知識,快速準確完成文稿中的各種錯誤內容識別,并給出糾錯建議。該系統能夠代替傳統校對的工作,輔助內容審校者有效發現問題,提升校對質量及審稿效率,確保內容安全生產。
數據安全中心滿足等保V2.0“安全審計”“個人信息保護”的合規要求的基礎上,提供敏感數據識別、數據安全審計、數據脫敏、智能異常檢測等數據安全能力,形成一體化的數據安全服務。
根據中高考試題分析發現,科學探究不僅是中學生物教學的重要內容,也是中考和高考的重點考查內容。初中階段培養學生實驗探究能力,熟悉科學探究一般過程,能夠為學生進入高中后熟悉實驗工具,設計實施可行的探究方案等較高級別的科學探究能力打下基礎。經典的科學史材料(如薩克斯實驗)能讓學生重溫科學家的科學探究過程,養成科學嚴謹的探究態度。教師要充分利用教材中的探究實驗,如探究種子萌發的外部條件,訓練學生熟悉科學探究的一般過程和分析實驗結果,表達交流的能力。
敏感數據主要包括核心技術資料、個人信息等高價值數據,這些數據以不同形式存在于平臺的資產中。敏感數據的泄露會給企業帶來嚴重的經濟和品牌損失。
DSC 可根據預先定義的敏感數據關鍵字段,掃描MaxCompute、OSS、數據庫服務(RDS、DRDS、PolarDB、OceanBase、表格存儲)和自建數據庫中的數據,通過敏感數據規則中的命中次數來判斷是否屬于敏感數據。
大數據整體架構,如圖3所示。
圖3 大數據整體架構
該部分主要提供整個大數據平臺技術、計算和存儲資源支撐。大數據技術中心提供的數據架構平臺,可以支持各種類型的數據接入以及上層應用程序的數據消費,可以作為的數據資源池。技術中心提供全數據采集、全數據存儲、IT 資源管理、系統配置(安裝部署、服務監控和安全)以及可視化大數據操作管理功能。
該部分包括多觸點數據采集、數據清洗、門戶設計。
大數據管理平臺對輸入平臺的原始數據進行處理,從而形成企業的數據資產,便于基于數據實現精準營銷和數據化運營。
數據采集。本系統支持收集3個維度數據:第一方數據源客戶端、主站、政務網群、其他業務網站、H5站點、手機報、微博微信等;第二方數據源收集;第三方互聯網數據、SNS 數據、電商數據等。
數據源。可來自用戶注冊數據、內容管理系統的數據、用戶觸點數據、互聯網數據等,通過定時導入、全量導入、實時觸發、文件傳輸、實時抓取采集等。
數據清洗。根據業務需求,排除重復數據、內部測試數據、殘缺數據和錯誤數據產生的數據。
數據標準化。根據數據標準和業務需求,規整數據的標準。
數據交換。大數據管理平臺提供的大數據應用與交換接口,實現數據標準、數據交互。
數據挖掘。大數據管理平臺提供分析模型、算法以完成大數據統計分析等上層數據應用。
大數據應用服務中心包括用戶行為洞察系統、自動化廣告系統、大數據運營分析系統。其具體功能包括:用戶登錄、內容推薦(千人千面)、精準服務、用戶微觀畫像、用戶宏觀畫像、用戶忠誠/流失、DSP 數據對接、廣告效果分析、廣告推薦分析、流量分析、渠道分析、頻道分析、內容分析。
媒體指揮智能平臺,通過大數據、云計算、人工智能技術,實現中央調度、一次采集、多種生成、多元傳播新聞生產流程,一站式解決融合發展技術難題,從選題策劃、采編生產、分發傳播、盈利分成全流程突破融合瓶頸。