童曉雯 康琪瑤 袁小群
摘 要 數字出版政策對于規范、引導并促進數字出版產業發展具有重要意義,分析其內容特征可為后續政策制定與優化提供參考和指導。鑒于此,文章運用文本挖掘方法,引入高頻詞共現網絡和PMC指數模型,對2006年以來的270余項數字出版政策內容進行分析和評估,以期找出其固有特征,為后續相關政策的制定提供借鑒。結果表明:一個合理政策應包括文化屬性、意識形態、宏觀管理以及服務體系等4個方面的屬性,我國已有數字出版政策總體表現優良,但仍有優化提升空間,后續政策制定時有必要在政策客體、政策評價和政策工具等方面加強。
關鍵詞 數字出版;政策評估;文本挖掘;PMC指數模型;共現網絡分析
數字社會,作為出版產業發展迅猛的新興出版形態,數字出版已成為新聞出版業的主要發展方向和文化產業發展的重要組成部分。近3年《中國數字出版產業年度報告》顯示,我國數字出版2020年、2021年以及2022年整體收入分別為11 781.67億元、12 762.64億元和13 586.99億元,較上年增長率分別為19.23%、8.33%和6.46%,均超同期國內生產總值的增長率。盡管數字出版在市場調節與政府指導的雙重作用下保持著良好的發展勢頭且取得了豐碩的成果,其發展過程中仍存在諸多問題。如傳統出版向數字出版轉型及融合受阻,受眾日益增長的多樣化需求與技術研發和工業應用水平不一致等[1]。這些問題的解決需要合適的產業政策來加強市場調節,優化資源在產業中的配置,以推動數字出版產業的可持續發展。現有關于數字出版政策方面的研究主要集中數字出版政策回顧與梳理[2]、特定數字出版政策如版權政策[3]、區域性政策[4]、財稅政策[5]、文獻計量分析[6]以及從政策工具視角量化我國數字出版政策工具的運用現狀[7-8],缺少對數字出版政策內容本身進行挖掘分析。鑒于此,本文聚焦我國數字出版政策內容本身,通過文本分析的方式挖掘出我國數字出版政策內容特征,同時從政策內容的一致性視角對樣本政策的好壞加以評估。為此,本文以我國數字出版政策為對象,利用高頻詞共現網絡歸納出自2006年以來數字出版政策的內容特征。然后,引入PMC(Policy Modeling Consistency)指數模型,以我國數字出版政策內容特征為依據設計評估指標體系并對選擇樣本的政策內容一致性優劣進行評估分析,以期為后續數字出版政策的結構設計、內容制定和體系完善提供路徑借鑒。
1 研究設計
不同于已有的數字出版政策分析工作,本文從政策內容視角對我國數字出版政策文件進行分析并加以評估。
1.1 研究框架
本文首先利用自然語言處理和統計學方法,對選擇的樣本文件進行全文分析,找出我國數字出版政策內容關注點和重心的分布規律;然后,引入PMC指數模型并構建我國政策文本內容一致性評估的指標體系,設計相應的評估模型;最后,對選取的政策樣本進行一致性評估。
1.2 政策來源
與余鈞[9]工作相似,本文也僅考察中央及部委層級的數字出版相關政策。本文首先以“數字出版”“復合出版”“電子出版”“網絡出版”“出版數字化”等為關鍵詞,對中國政府網、北大法寶數據庫等進行檢索,選取發布日期在2006年1月1日—2022年12月31日的政策。在此基礎上,本文適當補充現有數字出版政策研究文獻中的政策并剔除與研究相關性較差的樣本,獲取國務院、原新聞出版總署、原新聞出版廣電總局等多個部門自2006年出臺的270余項數字出版政策。
1.3 研究過程
本文將270項數字出版政策導入自編python程序進行處理后得到初始高頻詞表,剔除“數字”“出版”等不具政策含義的高頻詞,得到有效高頻關鍵詞。然后,本文選擇前50個高頻詞繪制高頻詞共現網絡并對其進行聚類,以挖掘我國數字出版政策內容特征。
PMC指數模型通過包含多個變量的指標體系來評估政策建模過程中的一致性的優劣 [10]。考慮數字出版發展是一個階段性的過程,經歷了電子出版、網絡出版、復合出版、融合出版,本文選取8項各階段典型政策加以評估,如表1所示。
綜合已有研究成果[10]和數字出版政策文本內容特征,本文確定了PMC指數模型10個主變量及40個子變量,如表2所示。其中,政策性質(X1)和政策時效(X2)分別用來判斷數字出版政策性質及有效時長[11],并設定10年以上為長期,5~10年為中期,1~5年為短期。政策領域(X3)用來分辨政策作用的不同領域,政策工具(X4)用來衡量政府在數字出版產業發展過程中發揮的作用及采用的方法與手段,包括供給型、需求型及環境型3類。政策內容(X5)表明數字出版政策的重點內容及不同作用層面,政策視角(X6)考察不同政策視角的數字出版政策效應,分為宏觀、中觀和微觀三重。此外,由于數字出版政策的不同目標指向特定對象,因此設置政策客體(X9)變量以研究政策作用的對象。變量政策評價(X7)和變量政策公開(X10)用于了解政策制定的整體情況與公開狀況。
與Estrada[12]的構建方法一樣,本文首先計算數字出版政策的10個主變量和40個子變量的投入產出,然后逐個計算子變量的值,再計算每個主變量的值,最后生成每個政策樣板的PMC指數,獲得該政策的評估結果。同時,鑒于PMC曲面繪制僅是對PMC指數評估結果的直觀展示而無額外含義,本文忽略PMC曲面繪制步驟。
2 數字出版政策的核心內容
圖1顯示270項數字出版政策中出現的頻率較高的50個詞對應的高頻詞共現網絡。在圖1中,出現頻次越高的詞語所對應的文字標簽和點越大。顯然,數字出版政策涵蓋文化產業、服務體系、科學技術、版權保護等內容,涉及經濟、科技、政治等政策領域。“文化”一詞在數字出版政策中出現頻次最高,達10 195次,表明數字出版具有強烈的文化屬性。“服務”“企業”“技術”等高頻詞的出現反映了數字出版政策的側重點,如服務體系建立,企業改革,技術創新等數字出版發展過程中面對的需求與前進方向。圖1顯示數字出版政策高頻詞被劃分為以文化、社會、服務和國家為核心的4個類別,體現了270項數字出版政策的4個中心內容體系。
“文化”詞頻最高表明數字出版的文化屬性為當前數字出版政策最核心內容。內容是出版物的內核,技術水平決定數字出版物的呈現形態。推動文化創新和技術發展,才能緩解用戶多樣化需求與數字出版發展不匹配的問題。因此,在市場需求與政策指導的雙重驅動下,出版企業積極探索以先進技術為支撐的多種出版形態,有聲書、電子書、動漫等新型出版物的興起即創新發展的結果。文化屬性層面另一大側重點是積極引導建立國際機構的同時鼓勵國際合作,這也體現了國家在數字出版產業需求型政策工具方面所做的努力。再次,為保證數字出版持續健康發展,數字出版政策對人才隊伍建設、產品研發、出版項目研究等方面也提供了指導和幫助。最后,數字出版政策對地區生產也給予了一定支持與關注,鼓勵少數民族文化的傳承與發展。
在意識形態層面,從共現圖可以看出我國數字出版政策堅持社會主義出版理念,把社會效益放在首位,實現社會效益與經濟效益相結合。出版的本質是傳遞知識、傳播信息、傳承文明,用人類創造的知識來提高人的素質,從而推動社會進步。出版工作是黨的宣傳思想文化工作的重要組成部分,是促進文化繁榮興盛、建設社會主義文化強國的重要力量。出版物對廣大人民具有思想道德、行為、價值觀等方面的深遠影響。出版業不但要創造經濟財富,更重要的是創造文化財富,推動人類文明的進步和發展,促進社會的進步。因此,政策對數字出版同樣提出了堅持正確導向的要求。
在宏觀管理層面,數字出版政策重點可概括行政部門改革、活動規劃與工程實施和知識產權保護等3方面內容。數字出版發展初期由原國家廣電總局、原新聞出版總署、原文化部等多個部門負責質量監察、違法查處等職能。例如網絡游戲由文化部主管,但網絡游戲出版物的前置審批權又歸原新聞出版總署擁有,多個部門的協調管理降低了數字出版的規制效率。從2013年國家新聞出版廣電總局的設立到2018年國家廣播電視總局的設立,這種多頭管理的現象有所變革。此外,隨著信息技術對社會的賦能,數字閱讀成為人們獲取知識與信息的新型途徑,原新聞出版總署自2011年起每年組織開展全民數字閱讀專題活動。“出版融合發展工程”“中華民族音樂傳承出版工程”等相關工程的組織實施也有助于推動數字出版產業的發展。最后,知識產權的保護是文化創新發展必不可少的基礎,近些年我國出臺了一系列保護知識產權打擊盜版的相關政策,同時組織開展“劍網”等打擊網絡侵權盜版專項行動。
在服務體系方面,國家通過政策積極推動數字出版服務體系建立及標準制度完善,以解決長期制約我國數字出版發展的標準化問題。為此,移動游戲出版服務管理、互聯網新聞信息服務管理規定等政策對數字出版公共服務體系的建立予以規制,《中國標準關聯標識符(ISLI)》《MPR出版物》系列國家標準的貫徹實施也改善了數字出版產業標準不統一的發展困境。為了規范數字出版物生產和發行,促進數字出版健康可持續的良好發展,相關部門也發布了《網絡信息內容生態治理規定》《關于加強數字出版內容投送平臺建設和管理的指導意見》《互聯網信息服務管理辦法》等一系列規章制度。
3 數字出版政策效果分析
基于1.3的4個步驟可得8項數字出版樣本政策的PMC指數,參考已有研究成果[12],本文將PMC指數分為4個級別:PMC指數在8.5~10分之間的政策可評價為優秀,位于7~8.49分可評價為良好,5~6.99分可評價為合格,5分以下則為不良。按照該評價標準對8項樣本政策進行級別劃分如表3所示。
由表3可知,本次選取的8項數字出版政策樣本中P2、P3被評估為優秀,P4、P5、P7和P8等4項被評估為良好,P1、P6被評估為合格。而從各政策指標均值視角來看,X10> X6>X5>X8>X2>X7>X4=X3>X1>X9。其中政策公開和政策視角兩項均分超過0.9,表明我國數字出版政策在這兩個方面做得異常好。而政策客體方面均分只有0.56,勉強合格。這意味著我國數字出版政策制定過程中容易出現作用對象不夠明晰的現象,主要原因在于當前政策的制定大多指向政府相關部門與產業中的企業,而較少指向產業的受眾和相關非營利組織等主體。此外,表3也顯示部分指標雖然其均分顯示較高,但其各樣本政策得分并不均勻,波動較大。如政策評價和政策工具均分分別為0.75和0.78,但均有兩個主變量數據不合格或勉強合格。造成上述的主要原因在于我國數字出版政策對環境型和供給型政策工具的使用情況比較良好,但缺乏細化的實施方案。對于需求型政策工具的使用,政府還未給予足夠重視。顯然,后續有關部門在制定數字出版類政策時有必要注意政策客體、政策工具和政策評價等方面的內容。
上述8項政策樣本中,政策P2《關于加快我國數字出版產業發展的若干意見》不僅在總體評價上表現優異,其還分別在政策性質(X1)、政策工具(X4)、政策內容(X5)、政策視角(X6)、作用層面(X8)和政策客體(X9)6個主變量評價中達到最高值。其主要原因在于該政策對數字出版當前的發展現狀與存在問題做出了基本描述,提出了數字出版未來的發展目標及指標,規劃了加快發展的主要任務和保障措施,所以在政策性質上表現優良。政策中建議加快數字出版產業標準制定,以創造公平的市場競爭環境,鼓勵數字出版機構“走出去”開發海外市場,提出政府應在人才、資源、資金等方面支持數字出版產業,運用環境型、需求型、供給型政策工具加快我國數字出版發展。顯然,無論是對于文化、科學技術、產品形式及內容的創新,還是加快產業服務平臺和標準建立,完善相關法律法規等內容,該政策都給予了一定關注并提出了對應發展任務。而且P2在政策視角、作用層面和政策客體層面也做了全面考慮。綜合來看該政策對于加快我國數字出版發展的問題提出了全面客觀的建議,但在規劃時間及具體實施方案上稍顯欠缺。
作為8項政策樣本中被評估為合格的政策樣本P6《網絡出版服務管理規定》評估為6.15分。該政策除了在政策公開和政策時效方面表現優異之外,其他8個主變量表現一般,尤其在政策性質(X1)、政策工具(X4)、政策視角(X6)、政策評價(X7)及作用層面(X8)5個主變量評分中均為最低分。仔細分析該政策內容可以發現,P6政策聚焦于網絡出版服務行為規范和加強內容監管等方面,僅在較狹窄范圍內對網絡出版服務管理做出了監管與規定,缺少詳細的目標、周密的規劃與翔實的方案。事實上,造成該政策的不完備有其客觀存在的現實原因。首先是網絡出版服務業快速發展,亟須加強引導和規范。2002年頒布《互聯網出版管理暫行規定》時,從事網絡出版活動的網站數量較少且形式單一。隨著網絡技術的迅猛發展,網絡出版形式增多,導致各類非法網站和淫穢色情、有害信息等違禁內容監管難度劇增,亟須完善有關法規和規章。其次,第十二屆全國人民代表大會第一次會議批準《國務院機構改革和職能轉變方案》和《國務院關于機構設置的通知》設立國務院直屬機構國家新聞出版廣電總局,國家對總局開展網絡出版服務管理的范圍、邊界等進行了劃分和調整,亟待將新聞出版廣電總局的相關職責要求納入規章之中。這樣,滿足產業發展實踐需求和機構調整的政策支持就成為本政策亟待解決的核心問題,也就導致其對網絡出版服務行為的概念、網絡出版許可的條件以及網絡出版的編輯責任制等基本問題的解決不徹底,PMC指數得分較低。
4 結語
本文綜合利用文本挖掘和內容分析方法,對2006年以來的270余項數字出版政策內容進行了深入分析。結果表明:我國數字出版政策內容體系應包含文化屬性、服務體系、意識形態與宏觀管理等4個部分。這與我國數字出版的文化屬性、商業屬性、意識形態宣傳功能和公共政策的管制引導功能契合。8項數字出版樣本政策的實證分析結果顯示我國數字出版政策整體質量較好,但依然有少量政策PMC指數得分較低,仍有改善空間。首先,針對我國數字出版政策大多指向政府相關部門與產業中的企業,而較少指向產業的其他主體的現狀,后續政策制定時可考慮增加對受眾以及高校、公益機構等組織的鼓勵與規范等方面的內容,全面激活數字出版產業各主體的積極性。此外,在政策工具層面,未來政策可加大對數字出版市場需求刺激的方法與手段,以改善當前政策對需求型政策工具使用不夠重視的現狀。最后,可以考慮設置數字出版產業管理部門,并出臺與產業發展階段及環境配套的相關法律法規,保障數字出版產業的良好發展。
(責任編輯:翟艷榮)
參考文獻
[1] 儲鵬. 基于內容分析法的數字出版產業政策研究[D]. 武漢:武漢大學,2020.
[2] 周艷敏. 我國數字出版產業政策法規回顧與展望[J]. 中國出版,2013(21):44-47.
[3] 肖江濤,丁德昌. 論我國數字出版企業的版權保護機制構建[J]. 出版廣角,2018(24):37-39.
[4] 甄增榮,武春霞,李玥. 數字出版產業的區域性及發展對策:河北省出版產業的比較優勢與政策供給[J]. 出版發行研究,2017(6):47-50.
[5] 胥力偉. 加快數字出版產業發展的財稅政策研究[J]. 科技與出版,2016(11):81-84.
[6] 陸維儀. 我國數字出版產業政策理論研究回顧與展望:基于文獻計量的分析[J]. 出版發行研究,2018(12):41-45.
[7] 常嘉玲. 基于內容分析法的我國數字出版產業政策優化路徑探究[J]. 出版發行研究,2019(4):24-29.
[8] 張窈,儲鵬. 我國數字出版政策工具選擇體系及其優化策略研究[J]. 科技與出版,2021(2):31-42.
[9] 余鈞,戚德祥. 數字出版政策的演進脈絡及新階段政策取向[J]. 科技與出版,2023(10):47-54.
[10] 宋大成,焦鳳枝,范升. 我國科學數據開放共享政策量化評價:基于PMC指數模型的分析[J]. 情報雜志,2021,40(8):119-126.
[11] ESTRADA M R,YAP S F,NAGARAJ S. Beyond the Ceteris Paribus Assumption: Modeling Demand and Supply Assuming Omnia Mobilis[J]. Social Science Electronic Publishing,2010.
[12] ESTRADA M R. Policy modeling:Definition,classification and evaluation[J]. Journal of Policy Modeling,2011,33(4):523-536.
貢獻聲明:
童曉雯:在論文成稿過程中,主要負責研究設計、論文撰寫和修改。
康琪瑤:在論文成稿過程中,主要負責數據收集與處理、初稿資料收集與整理。
袁小群:在論文成稿過程中,主要負責選題、研究設計、論文修改。
作者簡介:
童曉雯(1984— ),女,出版中級,湖北長江傳媒數字出版有限公司項目經理,專注于出版數字化轉型升級、融合發展工作近10年,作為骨干成員策劃、申報并實施國家及省級融合出版項目20余項。
康琪瑤(1998— ),女,武漢大學信息管理學院碩士研究生,國家新聞出版署語義出版與知識服務重點實驗室助理研究員。主要研究方向為數字出版、出版知識服務,在《出版科學》等期刊發表了學術論文。
袁小群,武漢大學信息管理學院副教授、出版科學系副主任,語義出版與知識服務實驗室室務委員會副主任,主要研究科技期刊出版、數字出版與出版知識服務、數據分析與人工智能、計算機網絡應用,發表中英文學術論文70余篇,出版學術專著2部。
Research on Text Mining—Based on Analysis and Evaluation of Digital Publishing Policies in China
Xiaowen Tong1Qiyao Kang2Xiaoqun Yuan2
1.Hubei Changjiang Media Digital Publishing Co.,Ltd,Wuhan 430070,China;2.School of Information Management,Wuhan 430072,China
Abstract The digital publishing policy is of great significance in regulating,guiding and promoting the development of the digital publishing industry. Quantitative research on its content may provide reference and guidance for subsequent policy formulation and optimization.In this study,text mining methods,including high-frequency word co-occurrence networks and the PMC (Policy Modeling Consistency) index model were implemented to analyze and evaluate the content of 270 Chinese digital publishing policies since 2006.The results show that a reasonable policy should include attributes such as cultural attributes,ideology,macro management and service system.Overall,Chinese digital publishing policies have performed well,but there is still room for improvement.
Keywords Digital publishing;Policy evaluation;Text mining;PMC index model;Co-occurrence analysis networks