文|何李白
媒體云平臺:大數據時代傳媒行業的轉型設想
近年來,傳統媒體都在嘗試各種辦法革新,出現最多的是新媒體,其次是電商媒體,行業垂直媒體以及智慧化媒體等等。
首先我們來分析新媒體,新媒體最常見的做法就是把傳統媒體的內容搬上PC屏、PAD屏、手機屏等,充其量只是傳播媒介的豐富、渠道的豐富,其內容生產方式卻沒有真正的改進。無論是“渠道為王“還是”內容為王“,最終讓用戶接受的還是獨到的內容,內容的未來,一定是給用戶提供深度的解讀,從新聞層、知識層、問題層、交互層分別做出為大眾所需要的解讀,因此未來的內容生產一定是靠數據驅動的,大數據時代下的媒體轉型,一定是用數據來驅動的內容生產和傳播,應用于各類報刊、媒體App、垂直行業媒體等,為持續不斷的內容生產提供指導。
我們再來看電商媒體,一些時尚消費類的媒體在電商方面進行了探索,主要思路是把讀者變為買家,目前成功案例不多,大部分仍屬于試水階段。首先是因為用戶體驗的不足,電商注重更多的是體驗帶動的經濟,包括產品豐富度、精美度、信譽度、折扣、送貨速度、包裝、口碑、購買方便性等,而媒體在這些方面的理解和執行比較原始和保守;其次是會員體系管理的不足,電商一般都有完善的會員政策,如金卡、銀卡、普通會員等不同的服務以及各類會員的升遷路徑等等,用戶忠誠度與用戶粘性都是其運營手段;最后媒體固有的編輯部、廣告部、發行部架構難以適應電商的業態,電商體系通常都是采用扁平化,把多個部門融合在一個業務流程里。總的來說,傳統媒體只有加強會員化思維、體驗化思維、扁平化管理思維才能往電商媒體走的更近。
行業垂直媒體如今遍地開花,具有一定的投資價值,如游戲從業者,無論是CEO等高管還是普通員工,每天都會閱讀Gamelock、游戲陀螺、游戲葡萄這類游戲產業的B2B媒體,以獲得最新的業內資訊和研究數據。一個垂直媒體,僅僅需要幾名員工,內容通常是原創+編譯+轉載,而傳統媒體通常需要設置主編、副主編、編委、主任、副主任、記者站站長、銷售、發行人員,市場人員等等,人力支出如此龐大,其經濟壓力可想而知。如果行業垂直媒體能把用戶進行細分,提供以個性化服務,精準投放內容,并進行多渠道傳播,就是媒體未來的一個新方向。
智慧化媒體是近幾年炒得比較熱的概念,其特征是具備思考、感知、識別等多維度智能,能主動尋求目標受眾并融入受眾的社會關系網,出現核裂變式的傳播,如根據用戶的情緒感知為其提供高清、娛樂的內容;根據受眾所在的地方、時間和消費習慣,能主動提供家庭娛樂、親子和家庭購物等信息。智慧媒體的出現以互聯網為基礎,依托不同的智能終端,并結合云計算、大數據等新技術,快速地判斷、分析用戶想要的內容,這種跟隨時間、地點、情緒、各種偏好、習慣、社會關系網等多維度因素,要結合社會多方面數據資源組合進行大數據分析,智慧化媒體將是媒體未來最重要的創新方向。
根據以上幾大媒體轉型戰略分析,僅僅以“內容為王”不再靈光了,以精英控制的中心化的傳統媒體時代逐漸沒落,而專業素養和媒介能力會滲透到社會生產和生活方式的各個環節和方面,媒體生態化會形成真正以人為中心,以經營為核心,以跨界、平臺連接與協作為特征的新型組織關系,媒體生態化需要把各行業媒體組合成一個媒體云平臺,平臺首先建立報業知識庫與用戶數據倉庫,以DGC(數據生產內容)+UGC(用戶生產內容)作為核心功能,以輿論引導服務,傳播服務、智能推薦服務、知識圖譜服務、數據新聞服務支撐幾大多元化媒體發展,平臺最終走向生態化服務商業模式,建立整體媒體圈生態環境,讓內部新媒體、草根自媒體、行業垂直媒體創業者、電商媒體創業者進來一起玩,生態業務模型如圖1。
傳統媒體集團的優勢是積累了多年的海量信息知識庫、海量微博粉絲用戶及多種混合傳播渠道,但是缺乏各行各業的垂直與精細化和互聯網思維化;而小的媒體個體,在搭建大平臺、整合多方數據資源、大數據分析、多渠道傳播時,面對從成本投入到資源整合的龐大投入則顯得力不從心,可以把二者融合在一起,互為取長補短,形成一個各行各業的,真正的大融合。圖2是總體架構圖。
針對以上媒體云平臺的搭建,需準備以下幾項基礎工作:

圖1

圖2
平臺首先需要打通內外部數據,匯聚多源數據,覆蓋重點網媒、微博、手機客戶端、圖片、境外網媒、Twitter、Facebook等各類互聯網資源,與互聯網公司、科研院所建立合作關系,通過相應數據規范和接口規范,引入社外大數據資源,保證數據的準確、全面和時效性,規避信息孤島,第三方數據還需整合政府、電商、行業資訊、社交網絡等,構建真正意義的大數據,幫助解決各種媒體的新聞共享問題、內容生產問題、用戶細分問題、用戶粘性問題、智慧化問題、宏觀趨勢問題等等。
隨著信息自動采集、發布、加工、創建、存儲等技術的發展,以及信息數據在分類、索引、聚類、關聯、翻譯、挖掘、摘要等智能處理技術不斷走向成熟和大規模的應用,為報業知識庫的建設奠定了基礎。隨著我國報業正醞釀著新一波信息化革命的熱潮,有關權威人士認為,新一波報業信息化的重點,將從信息基礎設施的改造和建設轉向新聞信息資源的開發與利用;新一波報業信息化的著眼點,將從提供生產手段、勞動工具和處理系統,轉向借助人工智能等信息處理技術,對這些數字內容資產進行有效管理,并通過數據挖掘等技術建成報業核心資產的報業知識庫,實現新聞媒體內容價值鏈的最優化,從簡單的“內容管理”逐步擴展到“知識管理”,實現從“手的延長”到“腦的擴展”的轉變。報業信息資料的深度加工處理與內容標簽化將成為報業信息化建設的重要核心內容之一,新一波的報業信息化將是在“告別鉛與火”“甩掉紙與筆”之后,迎來的“擴展腦與庫”的報業知識庫建設與使用的時代。
1、從“傳者中心”轉向“用戶中心”
互聯網思維首先是用戶思維,在價值鏈的各個環節都要“以用戶為中心”去思考問題,在技術和市場的雙重驅動下,我們發現,無論是移動化、視頻化、社交化,還是個性化、輕量化、社區化,用戶總是為了他們所感興趣的內容而聚攏起來,為了他們所關心的圈子而歡呼雀躍,由此我們看出兩個問題:一、你的用戶是誰?二、你的內容是給誰看?借助大數據技術,即可實現對用戶行為喜好等信息的精確分析,進而為提供精致和個性化的內容打下基礎。
2、用戶360度洞察視圖
用戶在網絡上點擊行為、交互行為、駐留時間等形成了大量的行為數據,基于這些數據的采集分析可以判斷用戶的喜愛和偏好,可以實現用戶個性化需求分析,形成豐滿的消費者畫像,進行用戶行為成長體系的建設和培育,并從中培養用戶對媒體的忠誠度。經過多年的發展,報紙的發行、雜志、網站、新媒體系統,營銷部門的線下活動等等,積累了百萬量級的用戶數據,但是,這些數據都分散在各自獨立的系統或部門,用戶活躍度低,信息不完整,分類信息不標準,需要對各大報刊、網站、App用戶、微信用戶、微博用戶數據進行清洗、存儲、抽取、合并,搭建一個統一的用戶數據倉庫,并從基本物征、瀏覽行為、交互行為、地理位置、社交網絡等多維度上給用戶進行標簽化,才可以對用戶進行360度深入洞察。
3、從單向變雙向:體驗至上,提升用戶分析價值
轉變為以用戶為中心的傳播模式后,用戶的體驗和反饋對媒體的改進尤為重要。因此,通過跨媒體的平臺來收集用戶意見,通過關聯分析受眾需求、偏好及行為模式,是提升用戶分析價值,增強用戶體驗滿意度的有效途徑。以電視媒體為例,可以通過數字電視或者是互聯網智能電視的機頂盒,采集與統計受眾對節目內容的接觸頻次、行為軌跡等數據,甚至提取受眾在觀看電視時快進、暫停產生的收視率數據與傳統媒體收視率數據匯總,以此找出受眾的興趣點和喜好所在,繼而建立起受眾收看習慣和口味偏好的強大數據庫,為受眾篩選出最適合的內容,再加以針對性推薦;此外還可打造個性化的推薦欄,生成“我的媒體單”,推薦符合受眾興趣偏好的內容產品,幫助其更快捷、方便地找到所需內容。大數據時代,結合個性化的數據平臺,通過有效的數據采集和受眾洞察系統,可以實現節目定制,為受眾帶來更好的觀看體驗和推送內容。
什么是知識圖譜?在互聯網時代,搜索引擎是人們在線獲取信息和知識的重要工具。當用戶輸入一個查詢詞,搜索引擎會返回它認為與這個關鍵詞最相關的網頁。從誕生之日起,搜索引擎就是這樣的模式,直到2012年5月,搜索引擎巨頭谷歌在它的搜索頁面中首次引入“知識圖譜”:用戶除了得到搜索網頁鏈接外,還將看到與查詢詞有關的更加智能化的答案。如圖3所示,當用戶輸入“MarieCurie”(瑪麗·居里)這個查詢詞,谷歌會在右側提供了居里夫人的詳細信息,如個人簡介、出生地點、生卒年月等,甚至還包括一些與居里夫人有關的歷史人物,例如愛因斯坦、皮埃爾·居里(居里夫人的丈夫)等。
我們把這個技術用到媒體領域,例如產生一個新聞時,根據知識圖譜計算出與這個新聞的相關程度,以及新聞本身的重要性,對新聞進行排序,作為結果返回給用戶,這項技術的引用可以更容易的從知識層解讀事實的真相。如圖3示例話題關系.
傳統報業是粗放型、廣種薄收的傳播,把所有的新聞信息向所有人傳播,缺乏針對性、精確度,人們時常淹沒在信息的海洋中而無所適從,報業也是如此。在建立了海量的歷史資料數據庫以后,所有的難點與突破點在于,你能否將正確的內容推送給正確的讀者。要做到這一點,就必須建立依托于報業海量的歷史數據資源和用戶群信息的基礎之上的智能推薦系統。通過智能推薦系統,在用戶使用、瀏覽我們的紙媒與所有新媒體信息時向其推送最有興趣、最想了解的信息或產品甚至廣告,這樣不但用戶的體驗度急劇上升,而且他們也非常樂意為你提供的產品或信息付費買單。智能推薦系統建設的關鍵在兩個方面,一是理解你所服務的對象,二是理解你所要推薦的信息或產品。只有使用機器學習、數據挖掘、搜索引擎、自然語言處理等相關技術理解了你所要服務的對象和所要提供的內容,才能實現將正確的內容推薦給正確的服務對象。所以智能推薦系統建設的兩個重點就是:一是依托以報業海量的歷史數據資源等為主的知識庫的內容與廣告等產品進行產品深度挖掘、分類,為推薦系統提供高可用的原材料;二是通過熱線電話、網站會員、手機用戶、網絡用戶瀏覽行為與習慣建立詳細的用戶數據庫,對用戶數據庫進行充分的數據挖掘,通過對他們的學歷、學科背景、興趣、愛好、關注對象、瀏覽信息的歷史及行為模式等進行建模,來理解所要服務的對象。只有在充分理解用戶與自己的內容的前提下,才能建立真正可用、高效且能帶來可觀收益的智能推薦系統。
報業知識庫與智能推薦系統不僅服務于報業的服務對象讀者、用戶,報業內部的管理、經營與采編人員也是最大的受益者。在這兩個系統上可以建立數據模型進行深度的數據挖掘,為領導提供決策支持;可以為經營管理人員提供精確營銷數據,如廣告營銷能根據客戶的具體需求提供更精準的營銷方案;可以為采編人員采寫優秀的報道文章提供知識源泉與豐富的素材。

圖3
新聞數據化,即“讓數據說話”,是把新聞以數據可視化報道與解讀,讓數據與老百姓的生活聯系起來,他需要從多個層面解讀,如政府層、知識層、問題層、大眾層,讓人們不再迷失于文字中,形成更強生命力的產品。當出現一條新聞時,他需要采集與新聞有關的數據,進行加工處理再作統計分析,得到一些可以展示的圖表報表形態,這些圖表在一定層面能體現某方面的問題,等同于新聞的數據洞察。
數據新聞化,和上面的新聞數據化是相反的,他的工作流程是,收集多方數據來源,根據數據資源進行多方面分析統計與挖掘,根據多方面的結果綜合來分析,得到一些結論性的命題,這個命題即是從數據分析產生的新聞,如“中國創業環境世界96位,仍有9成富豪白手起家”,即是通過分析創業環境排名、創業成功人士分類綜合出來的新聞。這種流程更多的要讓統計學、計算機學的人員參與,把數據從多維度分析,然后讓新聞從業者配合他們,綜合發現新的數據新聞。
傳播是傳統媒體的優勢,從原有的報紙期刊,到新媒體的網絡傳播,結合智能推薦,可以精準化傳播給匹配的用戶,從而解決廣而灑之的盲目性,并把新聞予以360度的解讀。傳播至少需要2種傳播類型,一種是以公眾化、大眾化、熱點度、多角度、多層面解讀為主,這種適合在報紙,門戶網站,行業雜志進行傳播;另一種是以精準化、垂直化、智慧化為主,根據用戶特點、用戶環境、用戶偏好等進行個性化的傳播,典型的如微博用戶、新聞客戶端App用戶、行業App用戶等,不再是依靠自已本身生產內容,而是更多的為媒體生態提供傳播服務,這是一個新的大的改革點。
從輿論的產生到形成并作用于社會的每個環節中,新聞媒體一直都影響著輿論,與輿論之間建立了一種密切的關系。隨著網絡新媒體時代的到來,社會公眾的主體意識空前高漲,并且表達欲望也比以往更加渴望地體現出來。尤其是對于社會的公共事務,網民的參與意識極高,大部分網民都喜歡在網絡發表一些自己的看法。而且,網民群體也呈現多元化的特點。所以,傳統媒體在以網絡為代表的新媒體時代里,表現出來的是新聞輿論的主導作用不再那么的絕對和強大,傳統媒體遇到了引導輿論的瓶頸。對于媒體來說,搶占熱點新聞的“第一落點”至關重要。按照輿論學的理論:媒介通過及時公開地傳播新聞事實,迅速形成社會的注意中心和議論中心,就等于先行設置了一個輿論話題和方向。也就說,誰以最快速度傳播新聞給受眾,誰就贏得輿論制高點。
網絡媒體已被認為是繼報紙、廣播、電視之后的“第四媒體”。通過網絡媒體的各個傳播渠道,可以最快發現老百性的輿論信息,大數據技術中的4V目標,其中Velocity代表高速,就是以海量的數據中以最快的速度來發現價值,通過采用一些爬蟲技術、實時監控技術、實時內存計算技術,對論壇、新聞評論、微博、社區、空間等進行實時爬取,計算并進行文本挖掘,對輿論進行正負研判、輿論分類、輿情預警、輿論可視化,提供以正確的輿論方向,服務于各大多元化媒體。

圖4
大數據并不是追求時髦,他是解決問題的手段,要做大數據,這背后一定有運營的動力和能力,平臺需要精細化運營,業務需求、用戶導向是精細化數據運營的標準。其次還需要數據挖掘與分析應用的團隊,包括新據新聞制作、可視化展現、創意表達的信息產品生產人員,以及做用戶分析、產品分析、工具分析與模式分析的數據挖掘與運營人員。出色的數據分析師不會是孤立的,應該具備與部門、各業務的溝通與整合開發、應用能力,具備統計、算法、建模、展現等能力。
報業海量的數據存儲與計算分析,需要大規模、高可靠、高性能的存儲與計算技術,需要針對大規模數據分析場景所設計的媒體大數據產品,能夠提供TB/PB級別以上的數據分析處理能力及一站式的數據運營能力,需要在數據采集方面具有采集工具豐富、采集類型多樣、采集方式靈活、采集性能強勁的特點,同時存儲能力和計算能力都相當高效和可靠安全。在數據應用方面需要涵蓋數據的交換、存放、建模、開發、分析、展現、管理、共享等多個功能,能夠賦予用戶快速便捷的創建、維護大數據應用的能力。我們正與阿里巴巴集團旗下數夢工場展開合作,希望基于其大數據一體機研發針對大規模(TB/PB級別以上)的數據分析場景所設計的媒體大數據產品(圖4)。
總之,在大數據時代背景下,依托報業海量歷史資料建立的知識庫是基石;最關鍵的核心競爭力還是以用戶為中心、挖掘知識圖譜、正確輿論引導、智能推薦系統和數據新聞服務。當這些系統都成功有效地運行時,有了用戶的信任度、粘合度和報業強大的內容生產和經營管理能力,那么報業的最終目標——實現可觀的經濟社會效益將會順理成章、水到渠成。