■文/ 馬國寶
大數據分析技術及其在數字出版中的運用探究
■文/ 馬國寶
我國的經濟社會不斷發展,網絡信息技術水平不斷提升,其與社會各個行業的融合日益緊密。大數據分析技術是現代技術的代表,將其應用在出版行業中,可以收獲良好的效果。為了發揮大數據分析技術的實用價值,必須推動新媒體出版行業的發展。本文將具體探討大數據分析技術及其在數字出版中的運用,希望能為相關人士提供一些參考。
大數據分析技術;數字出版;運用
進入21世紀以來,我國的社會主義市場經濟持續繁榮,現代技術發展更加迅速。在信息化時代中,數據信息是最具價值的資源。出版行業記錄著大量的出版信息,為了實現行業發展,必須對數據信息進行分析,制定科學的發展決策。大數據分析技術改變了傳統的新聞出版模式,催生了數字出版這一新模式。為了擴展數字出版的范圍,必須探討大數據分析技術的實踐意義。
1.1 內涵
所謂的大數據分析技術,就是以互聯網技術作為依托,對數據進行儲存、管理和精準分析,從中識別有用信息,自動剔除無用信息的現代化技術[1]。大數據分析技術具有突出的實用功能,得到了各個行業的普遍重視。
我國的經濟社會不斷發展,網絡信息技術滲透了人們日常生活的方方面面。人們在生產生活中會接觸到大量的數據信息,只有對海量數據信息進行分析,才能提升數據處理能力,實現自身的可持續發展。傳統的信息處理手段具有滯后性,存在時間延緩的弊病,信息處理結果只能反映上一時段的情況。大數據技術彌補了傳統信息處理方式的不足,將各種數據信息整合到了一起,可以對實時數據進行快速分析。
就內容來看,大數據技術包括對數據流進行預測、對數據庫進行管理、對數據算法進行優化等。就方法來看,大數據技術包括數據收集方法、數據錄入方法、數據處理方法等。就操作來看,大數據技術包括數據挖掘、數據庫建構、數據統計等。
1.2 數據挖掘
數據挖掘是大數據分析技術中最重要的操作方法。數據挖掘又稱數據開發,是對互聯網中的海量數據進行開發,從中甄選出最具價值的實時信息。外部環境處在不斷發展變化中,數據也具有極強的變化性,數據挖掘以數據實時特征作為基點,可以對數據資源進行類別化分析。具體來說,數據挖掘操作包括以下幾個環節。
第一是劃分數據的類型。在互聯網中有大量的數據信息,為了方便管理,需要形成不同的數據庫,記錄不同類型的數據。就出版行業來看,數據信息包括用戶信息、出版社信息、書籍信息等,數據發掘可以將數據分門別類地保存在數據庫之中;第二是對數據進行細分。每一類數據都可以被劃分為不同的層次,以用戶信息為例,包含用戶偏好信息、用戶產品信息、用戶屬性信息等;以出版社信息為例,包含出版社營業信息、出版社配送信息、出版社銷售信息等;以書籍信息為例,包含書籍作者信息、電子書籍信息、書籍促銷信息等;第三是分析數據信息的特征。每類信息都有突出的個性化特征,數據挖掘可以將數據信息放在一起,從中提取出最具價值的特征信息;第四是對數據的回歸分析。數據有一定的流動性,數據挖掘可以根據數據流方向,對出版行業的書籍銷售趨勢進行預測。
2.1 內涵
所謂的數字出版,就是依托網絡數據信息的新型出版模式。數字出版以網絡信息技術作為基礎,可以彌補傳統出版模式的不足之處。數字出版具有極強的系統性特征,不僅包括出版方式的數字化,還包括出版業務、用戶消費的數字化等[2]。在采用數字出版的過程中,需要依靠互聯網技術構建信息平臺,在平臺上為用戶提供電子閱讀書目。用戶在閱讀之前,需要先支付一定的閱讀費用,與商家進行交易。
2.2 優勢
首先,數字出版具有突出的便捷性特征。數字出版以網絡信息技術作為支撐,儲存了大量數據信息。在搜索數據的過程中,用戶可以根據數據類型尋找到相應數據,節省大量搜索時間。出版行業的每個鏈條都有相關性,數字出版可以在網絡平臺上傳遞數據,實現信息的交互和共享。傳統出版以人的操作為主,誤差較大,耗費成本較高。數字出版以智能操作為主,誤差較小,耗費成本較低。從這個角度來看,數字出版已經成為出版行業發展的必然之勢。
其次,數字出版具有突出的豐富性特征。就目前來看,我國的數字出版包括數字報刊、電子書、電子地圖等多種產品,各種移動終端都可以加載上述產品。隨著網絡信息技術水平的不斷提升,線下出版產品已經擴展到了線上。與傳統出版相比,數字出版可以帶給用戶更加直觀的服務體驗,改變用戶的娛樂方式。
再次,數字出版具有突出的發展性特征。數字出版以互聯網技術作為依托,互聯網技術不斷發展,數字出版的發展速度也會不斷加快。在信息化時代中,數字出版已經引起了大眾的關注,成為最具活力的現代技術產物之一。大數據技術為數字出版注入了新鮮的血液,勢必會推動當代出版行業的發展。
3.1 出版流程
大數據技術可以被應用在數字出版的各個環節之中,節省出版時間。具體來說,數字出版包括以下幾個流程:第一是準備出版產品,對產品特性進行分析,分門別類進行管理;第二是制定產品營銷策略,對市場情況進行分析,和大眾媒體進行聯合;第三是優化配置人力資源和物力資源,對每個工作環節的工作量進行測算,工作量越大,人力資源和物力資源的輸出越多;第四是對用戶進行集中管理,儲存海量用戶信息。比如,在準備出版產品的過程中,可以應用大數據技術中的RDM系統[3]。RDM系統是智能網絡管理平臺,可以對出版產品進行集中管理,為了輔助RDM系統的工作,也可以構建ERP系統,并劃分兩個管理系統的工作內容。在系統產生數據后,要應用大數據技術,對實時數據進行精準分析。如果產品信息出現訛誤,需要對其進行二度審核,并修正訛誤信息。
數字出版流程有兩條線索,第一條是業務流程線索,第二條是管理流程線索。出版流程不同,大數據技術的應用也呈現出差異。以業務流程為例,在設計業務流程時,需要利用大數據技術,考察市場消費情況和用戶的個人偏好,并將各種信息記錄在數據庫中。為了提高業務流程的設計水平,可以形成網絡信息平臺,吸引更多設計師的注意。以管理流程為例,在設計管理流程時,需要形成數據分析部門,對商業數據進行搜尋和處理。同時要考察供需關系,對投入產品比重進行控制。
3.2 出版產品
大數據技術可以被應用在數字出版產品中。在物質生活日益豐富的今天,人們的精神需求日益旺盛,對出版產品提出了更高的要求。出版產品只有滿足用戶的多元需求,才能促進出版行業的可持續發展。大數據分析技術可以對用戶需求進行調查,根據需求數據創新出版產品,為用戶提供多種選擇。在大數據技術的支持下,產品生產速度加快,產品的市場占有率不斷上升,創造了更多的經濟價值和社會價值。除了提供產品之外,數字出版還可以為用戶提供線上服務。大數據技術重構了數字服務的內容,跨越了時間和空間的界限。用戶只需要登錄網絡平臺,就能和供應商實現交互。
為了實現經濟效益的最大化,供應商必須采用有效的營銷策略,而營銷策略要以用戶偏好作為基礎。大數據技術可以為營銷策略提供海量數據,幫助出版行業構建新的營銷方式。一方面,大數據技術可以形成互動平臺,讓供應商和用戶相對接;另一方面,大數據技術可以綜合考量用戶需要,為用戶提供定制化的數字產品。
3.3 出版服務
大數據技術可以被應用在數字出版服務中。在大數據技術的支持下,數字出版更加智能,在很大程度上推動了我國出版行業和的發展。根據用戶的歷史數據,大數據技術可以為用戶推送相關內容,避免用戶在網絡上進行重新搜索。用戶的歷史數據包括用戶的消費偏向、用戶的內容喜好、用戶的個人評價等[4]。大數據技術需要按照主題、人物等,把產品劃分為不同的類型,盡量和消費市場相貼合。
在提供服務的同時,還應該和用戶建立好關系,讓用戶進行信息反饋。比如,在微信、微博等社交媒體中,應該汲取用戶提出的意見和建議。大數據技術可以對數據進行智能分析,供應商應該利用數據挖掘功能,對用戶體驗進行評價,以此為依據調整自身的服務方式。
綜上所述,我國的經濟社會不斷發展,出版行業進入快速發揮階段。為了擴展數字出版的范圍,必須探討大數據分析技術的實踐意義。
[1]王鵬,趙麗虹. 大數據和新媒體技術推動城市規劃轉型初探[A]. 中國科學技術協會、廣東省人民政府.第十七屆中國科協年會——分16大數據與城鄉治理研討會論文集[C].中國科學技術協會、廣東省人民政府,2015:7.
[2]劉實然. 面向出版行業的新媒體精準營銷系統的設計與實現[D].中國科學院大學(工程管理與信息技術學院),2015.
[3]滕躍民,滕莉. 新媒體的發展及技術與市場分析——“新媒體出版與傳播高級研修班”綜述[J]. 出版與印刷,2016(04):7-10.
[4]楊淑娟,劉景景,沈陽. 媒體微信公眾平臺服務發展現狀及對策——基于“新媒體指數”大數據平臺的分析[J]. 新聞與寫作,2015(02):10-14.
(作者單位:河南科學技術出版社有限公司)
G23
A
1671-0134(2017)07-067-02
10.19483/j.cnki.11-4653/n.2017.07.019