999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

京津冀協(xié)同發(fā)展報紙新聞主題發(fā)現(xiàn)及其關(guān)聯(lián)分析

2021-10-21 05:13:34李海峰
科學技術(shù)與工程 2021年28期
關(guān)鍵詞:關(guān)聯(lián)旅游模型

李海峰

(河北大學計算機教學部, 保定 071002)

京津冀協(xié)同發(fā)展上升為國家戰(zhàn)略,新聞媒體持續(xù)高度關(guān)注,積累了大量新聞報道網(wǎng)絡信息資源。隨著信息和媒體技術(shù)的快速發(fā)展,大規(guī)模新聞報道信息以文本方式存儲。大規(guī)模文本信息使得人們在信息處理和檢索上面臨前所未有的挑戰(zhàn)。為了深入理解京津冀協(xié)同發(fā)展新聞報道的整體概貌和主題分布,傳統(tǒng)的閱讀方法已經(jīng)不能滿足獲取信息的需求。采用基于數(shù)據(jù)挖掘技術(shù)的自動化處理和組織方式,從大規(guī)模新聞集中開展主題發(fā)現(xiàn)和主題演化分析,為用戶提供新聞信息整合服務,對京津冀協(xié)同發(fā)展國家戰(zhàn)略的研究具有較高的理論價值和實踐意義。

1 相關(guān)研究

1.1 新聞話題檢測與跟蹤

話題檢測與跟蹤(topic detection and tracking,TDT)是一項針對新聞報道進行信息識別、挖掘和組織的研究,主要包括報道切分、話題關(guān)聯(lián)識別、新事件發(fā)現(xiàn)、話題追蹤、話題發(fā)現(xiàn)等[1]。隱含狄利克雷分布(latent Dirichlet allocation,LDA)為經(jīng)典的主題模型方法,利用詞項在文檔層共現(xiàn)提取文本中的語義信息,即主題,同時將詞項矩陣轉(zhuǎn)化為主題矩陣[2]。時序信息是新聞文本的重要特征,將時態(tài)信息引入主題模型,從時間維度分析主題的新生、繼承、合并、分裂和消亡的演化過程,成為新聞文本挖掘的重要研究內(nèi)容。Griffiths等[3]將時間信息引入主題模型,提出了話題演化模型理論。Wang等[4]提出了TOT(topic over time)模型,采用Beta分布對給定時間范圍內(nèi)的文本主題強度變化進行建模,將文本、詞、時間三者相結(jié)合分析主題演化情況。Blei等[5]提出了動態(tài)主題模型(dynamic topic models, DTM),按照時間順序?qū)⑿侣勎谋炯瘎澐譃槿舾蓚€片段,每個片段按靜態(tài)模型的思路建模,最終形成主題隨時間的演化。王曰芬等[6]通過話題識別和主題關(guān)聯(lián)分析開展了新聞報道輿情評論在主題內(nèi)容和時間階段上的異同。目前普遍認為LDA的最大問題是難于確定最優(yōu)主題數(shù)目。

1.2 京津冀協(xié)同發(fā)展話題研究

京津冀協(xié)同發(fā)展成為廣大研究機構(gòu)和學者的重點研究對象,主要圍繞京津冀區(qū)域協(xié)同發(fā)展的體制機制改革、城市空間布局、產(chǎn)業(yè)轉(zhuǎn)移、交通一體化、生態(tài)環(huán)境協(xié)同治理等多個角度開展專題研究。為了全面了解京津冀協(xié)同發(fā)展的研究進展,孫威等[7]、李海峰等[8]、趙杰等[9]以中國知網(wǎng)期刊文獻為數(shù)據(jù)源,采用文獻計量學、共詞分析、概率主題模型等方法,對中國學者研究京津冀協(xié)同發(fā)展主題的內(nèi)容、強度和趨勢等進行深入分析。丁曼旎等[10]以Web of Science為數(shù)據(jù)源,從英文期刊論文角度對京津冀地區(qū)的研究熱點演化知識圖譜進行了分析。吳蕓等[11]、魏巍[12]、李雪偉等[13]以京津冀協(xié)同發(fā)展政策文本為研究對象,采用政策工具和政策文本分析等方法,分析了京津冀協(xié)同發(fā)展治理模式的特征和形成過程。然而,面對新聞媒體對京津冀協(xié)同發(fā)展宣傳報道,鮮有學者圍繞新聞報道信息進行深入研究和分析。

基于此,采用數(shù)據(jù)挖掘方法開展京津冀協(xié)同發(fā)展新聞報道的研究是非常有必要的。以“京津冀協(xié)同發(fā)展”媒體報道的大規(guī)模新聞集為研究對象,采用改進的時序主題模型方法進行基于主題和子主題的主題發(fā)現(xiàn)、主題關(guān)聯(lián)和主題演化等方面的研究,挖掘出傳統(tǒng)閱讀方法難以獲取隱藏在大規(guī)模新聞集中的系統(tǒng)性知識和隱含知識。

2 研究設計

2.1 方法流程

基于時序主題關(guān)聯(lián)演化的新聞文本分析方法包括新聞文本獲取、數(shù)據(jù)預處理、主題提取、主題強度計算、主題關(guān)聯(lián)關(guān)系、主題演化分析等多個步驟。與傳統(tǒng)主題模型方法[9]相比,本文方法提出了全局主題與子主題、時序主題與子主題和時序主題之間關(guān)聯(lián)計算的主題關(guān)聯(lián)演化分析模式,其研究框架如圖1所示。

圖1 研究框架Fig.1 Researchframework

2.2 LDA主題模型

LDA是Blei等[14]在2003年提出的一種文檔概率主題模型。LDA主題模型是一種非監(jiān)督機器學習方法,可以用來識別大規(guī)模文檔集或語料庫中潛在的主題信息。具體而言,LDA是三層貝葉斯概率模型,從低到高包含詞、主題和文檔三層次結(jié)構(gòu),其中,每個文檔表示潛在主題的混合分布,每個主題表示為固定單詞集上的概率分布。LDA主題模型描述如圖2所示,LDA模型中使用的符號如表1所示。

表1 LDA模型中使用的符號

圖2中,文檔是由單詞集w=(w1,w2,…,wn)構(gòu)成的序列。語料庫是由一系列文檔D=(d1,d2,…,dm)組成。LDA的聯(lián)合概率分布表示為

(1)

表示文檔m中的第n個詞,是可觀測變量,為已知信息; 表示潛在變量,為未知信息;方框表示重復抽樣(用于參數(shù)估計); 箭頭表示變量間的條件依賴關(guān)系圖2 LDA模型Fig.2 LDA model

式(1)中:w為可觀測變量;θ和z為隱含變量;zn和wn分別為指定的主題和特征詞;α和β由最大期望算法(expectation-maximization algorithm, EM)得到[15]。

2.3 確定最優(yōu)主題數(shù)

LDA主題模型采用困惑度(perplexity)作為評價模型好壞的標準,選取困惑度最小的模型確定最優(yōu)主題數(shù)[14]。困惑度的計算公式為

(2)

式(2)中:測試集語料庫D中有M篇文檔;Nd為文檔d中的單詞個數(shù);p(wd)為文檔d中詞wd產(chǎn)生的概率。

困惑度值一般隨著潛在主題數(shù)量的增加呈現(xiàn)遞減的規(guī)律,較小的困惑度值表示模型對新文本具有較好的預測能力,從而造成選取的主題數(shù)目往往較大,導致主題的辨識度不高。為了權(quán)衡模型的泛化能力和主題的抽取效果,采用基于困惑度和主題相似度相結(jié)合的評價指標(Perplexity-Var)來確定主題的最優(yōu)數(shù)目[16]。

Perplexity-Var指標引入主題方差到潛在主題空間,用于衡量主題空間整體的差異性和穩(wěn)定性,主題方差的計算公式為

(3)

當主題方差越大時,主題之間的差異性越大,主題之間的區(qū)分性越好,故將困惑度值和主題方差兩者結(jié)合起來,可以解決主題辨識度不高的問題。Perplexity-Var指標計算公式為

(4)

式(4)中: Perplexity(D)為數(shù)據(jù)集的困惑度,其值越小LDA的泛化能力好;Var(T)為數(shù)據(jù)集的主題方差,其值越大LDA主題抽取的效果越佳;Perplexity-Var指標越小是,對應的LDA主題模型最優(yōu)。

2.4 基于主題與子主題的關(guān)聯(lián)演化

主題演化過程需要考慮時間和內(nèi)容兩大因素,既要實現(xiàn)時間上的延續(xù)和關(guān)聯(lián),又要實現(xiàn)在內(nèi)容上按主題進行分類識別。要實現(xiàn)上述功能,基于主題與子主題的關(guān)聯(lián)分析流程如圖3所示。

圖3 主題關(guān)聯(lián)分析流程Fig.3 Topic correlation analysis process

2.4.1 獲取主題和子主題

通過對整個語料庫計算Perplexity-Var指標值,獲取全局主題數(shù)K和子主題數(shù)k。采用LDA模型獲取整個語料庫的全局主題-主題詞概率分布Z和子主題-主題詞概率分布z,可分別表示為

Z={Z1,Z2,…,ZK}

(5)

Zi={(Wzi1,Pzi1),(Wzi2,Pzi2),…,(Wzin,Pzin)}

(6)

z={z1,z2,…,zk}

(7)

zi={(wzi1,pzi1),(wzi2,pzi2),…(wzin,pzin)}

(8)

式中:Zi為全局主題-主題詞概率分布;(Wzin,Pzin)為全局主題詞及其概率值;zi為子主題-主題詞的概率分布;(wzin,pzin)為子主題詞及其概率值,用于分析整個語料庫中主題分布情況。

按新聞報道時間劃分l個時間窗口,語料庫劃分為l個子集,通過對時間片內(nèi)的語料庫子集計算Perplexity-Var指標值,獲取時間窗口內(nèi)的時序主題數(shù)K和子主題數(shù)k。采用LDA模型分別獲取各個時間片內(nèi)的時序主題Z′和子主題z′,可分別表示為

Z′l={Z′l1,Z′l2,…,Z′lK}

(9)

Z′li={(W′zi1,P′zi1),(Wzi2,Pzi2),…(W′zin,P′zin)}

(10)

z′l={z′l1,z′l2,…,z′lk}

(11)

z′li={(w′zi1,p′zi1),(w′zi2,p′zi2),…(w′zin,p′zin)}

(12)

式中:Z′l為l時間片時序主題-主題詞概率分布;z′l為l時間片子主題-主題詞的概率分布,用于分析l時間片語料的主題分布和時序主題間的關(guān)聯(lián)演化。

2.4.2 主題關(guān)聯(lián)關(guān)系計算

主題相關(guān)性判斷是進行主題演化分析的先決條件。通過計算某個時間片上時序主題與子主題的相似度,判斷主題內(nèi)容的語義信息和子主題劃分;通過計算相鄰兩個時間片主題間的相似度,判斷相鄰時間片主題的演化路徑。采用JS散度計算主題間的相似度[17],其計算公式為

(13)

(14)

式中:KL(p‖q)為兩個概率分布p和q間的KL距離;xi為概率分布p和q中的第i個詞匯,兩個概率分布p和q中詞匯總數(shù)均是n;JS散度大小為0~1,其值越小,表明兩個主題越相似,主題關(guān)聯(lián)關(guān)系越緊密,將JS散度值小于0.5的值分為弱(0.5,0.35]、中(0.35,0.25]和強(0.25,0]這3個等級,判斷主題間的相關(guān)性[9]。

3 實證分析

3.1 數(shù)據(jù)采集與預處理

主要以國家圖書館慧科報刊數(shù)據(jù)庫中有關(guān)“京津冀協(xié)同發(fā)展”的新聞報道為數(shù)據(jù)源,從大眾媒體視角觀測京津冀協(xié)同發(fā)展新聞報道的主題分布及主題演化趨勢。以主題包含“京津冀協(xié)同發(fā)展”為檢索詞,設定時間2014年1月1日—2020年12月31日為檢索區(qū)間,進行精確檢索,獲取147 299篇新聞報道,信息包括新聞標題、報道時間、報紙名稱、新聞版面、全文內(nèi)容等。

利用Python中的Jieba中文分詞工具對于 147 299 篇報道的新聞正文進行分詞處理。分詞工具中加入了京津冀協(xié)同發(fā)展領域的專業(yè)詞匯,確保分詞結(jié)果的合理性。利用中文分詞停用詞表,將分詞后的文本去除停用詞,最終形成用于統(tǒng)計分析和主題建模的語料庫。

3.2 報道概況分析

3.2.1 時間趨勢分布

采用數(shù)理統(tǒng)計方法,中國主流報紙媒體關(guān)于京津冀協(xié)同發(fā)展報道數(shù)量的時間分布趨勢如圖4所示。

圖4 新聞報道年度分布Fig.4 Annual distribution of news coverage

京津冀協(xié)同發(fā)展于2014年2月上升為國家戰(zhàn)略,新聞報道數(shù)量發(fā)生了較為明顯的變化趨勢,始終保持主流報紙媒體高度關(guān)注度。2014年是京津冀協(xié)同發(fā)展上升為國家戰(zhàn)略元年,除了3月、4月和12月新聞報道量較多外,其他月份相應報道量較低;受北京行政副中心和設立河北雄安新區(qū)等重大政策深入推進落實的影響,2015年、2017年年度新聞報道量均接近30 000,達到高潮;隨著京津冀協(xié)同發(fā)展政策的穩(wěn)步推進,2018年、2019年的新聞報道量趨于平穩(wěn);到2020年,隨著京津冀協(xié)同發(fā)展的深入落實,其新聞熱度逐漸降低,報紙新聞媒體對京津冀協(xié)同發(fā)展報道量出現(xiàn)明顯下降趨勢。通過新聞報道月度分布觀測,報道量最大的前3個月度分別是2017年4月、2015年7月和2014年12月。從新聞報道時間趨勢分布來看,主流報紙媒體對京津冀協(xié)同發(fā)展話題持續(xù)關(guān)注,經(jīng)歷了快速提升(2014年)、持續(xù)高潮(2015—2017年)平穩(wěn)發(fā)展(2018—2019年)和逐漸衰退(2020年)的演化過程。

3.2.2 報道來源分布

從媒體來源來看,147 299篇新聞報道來自中國638種報紙。依據(jù)文獻計量領域的布拉德福定律(law of Bradford)[18],對來源報紙進行統(tǒng)計分析,可以發(fā)現(xiàn)報道京津冀協(xié)同發(fā)展話題的核心報紙群,如表2所示。從報道來源的核心報紙看,報道京津冀協(xié)同發(fā)展的主流媒體是人民日報、中國新聞社等國家級媒體和京津冀三地的省級日報以及環(huán)北京周邊的河北省地級市日報,可以看出,京津冀地區(qū)的報紙是報道京津冀協(xié)同發(fā)展的主流報紙媒體。

表2 核心報紙和報道數(shù)量

3.3 全局主題分析

3.3.1 全局主題分布和主題強度

根據(jù)LDA主題模型分析的一般步驟,分別設定了6~200個主題數(shù),對整個語料庫的數(shù)據(jù)進行計算Perplexity-Var值,分別生成不同的主題分類組合,確定最優(yōu)全局主題數(shù)17和子主題數(shù)90,能夠較好地反映出2014—2020年中國主流報紙媒體報道京津冀協(xié)同發(fā)展的主題分布總體情況。對全局主題相近的進行合并,取前15個高概率主題詞,其主題詞分布情況如表3所示。

通過LDA模型獲取文檔-主題概率分布θij,根據(jù)計算主題強度計算方法[8],利用所有文檔在某個主題上的概率分布值的平均值描述全局主題強度,如圖5所示。

通過主題分布和主題強度觀測,主流報紙媒體報道京津冀協(xié)同發(fā)展的主題大體分為以下四類。

(1)圍繞學習貫徹落實黨中央推進京津冀協(xié)同發(fā)展精神的重要報道,如主題類1所示。各級政府、部門和組織通過會議、講話、報告、學習教育等多種方式落實京津冀協(xié)同發(fā)展國家戰(zhàn)略;其主題類強度最高,體現(xiàn)了報紙媒體對國家大政方針和社會重點問題的宣傳報道和積極引導作用。

(2)圍繞京津冀區(qū)域交通、產(chǎn)業(yè)、生態(tài)重點領域率先突破的重要報道,如主題類2、主題類4、主題類6、主題類10所示。國家和京津冀“三地四方”著力推動網(wǎng)絡化布局、智能化管理、一體化服務,構(gòu)建安全可靠、便捷高效、經(jīng)濟實用、綠色環(huán)保的綜合交通運輸體系;著力推進綠色循環(huán)低碳發(fā)展,加強生態(tài)環(huán)境保護,發(fā)揮重點治理工程帶動作用,節(jié)約集約利用資源,形成區(qū)域良好生態(tài)格局;著力實施創(chuàng)新驅(qū)動發(fā)展戰(zhàn)略,建設北京行政副中心和河北雄安新區(qū),促進產(chǎn)業(yè)有序轉(zhuǎn)移承接,推動產(chǎn)業(yè)結(jié)構(gòu)調(diào)整優(yōu)化升級。尤其是天津自貿(mào)區(qū)建設,構(gòu)建京津冀國際貿(mào)易大通道,服務京津冀企業(yè)國際化經(jīng)營,服務京津冀高質(zhì)量發(fā)展,成為報紙媒體重點關(guān)注的領域。

(3)圍繞京津冀區(qū)域市場要素的重要報道,如主題類3、主題類5、主題類8、主題類9所示。市場一體化是京津冀協(xié)同發(fā)展的核心內(nèi)容,市場資源的統(tǒng)一配置是激發(fā)區(qū)域經(jīng)濟發(fā)展活力的根本保障,資金、科技、信息、土地、人才、教育等市場要素自由流動成為制約京津冀協(xié)同發(fā)展推進的重要因素。通過報紙媒體報道的宣傳和引導,京津冀政府間應建立統(tǒng)一的市場法規(guī)和市場監(jiān)管制度,企業(yè)間應加強市場聯(lián)合聯(lián)盟和市場供需合作,保證市場要素合理流動,共同推動區(qū)域統(tǒng)一市場的形成。

(4)圍繞京津冀文化旅游協(xié)同發(fā)展的重要報道,如主題類7所示。文化旅游產(chǎn)業(yè)是帶動京津冀區(qū)域經(jīng)濟社會健康發(fā)展的有效路徑。京津冀地緣相接,歷史相通,區(qū)域文化資源一脈相承,呈現(xiàn)出集群化的特征。通過主題類7主題詞來看,依托冬奧會的冰雪游和體育游、依托旅游小鎮(zhèn)的休閑游和農(nóng)村游、依托區(qū)域特色文化游等特色文化旅游整合,進一步提升文化與旅游的深度融合,推進京津冀文化旅游協(xié)同發(fā)展。

3.4 主題與子主題關(guān)聯(lián)及演化

基于LDA主題建模,從全局和按時間片兩個層面對新聞報道進行主題提取,計算全局主題與子主題、時序主題與子主題、時序主題和時序主題之間的相似度,進而確定主題的演化趨勢。以全局主題Topic13“京津冀文旅產(chǎn)業(yè)協(xié)同發(fā)展”主題為例,開展主題關(guān)聯(lián)演化分析。

3.4.1 主題與子主題關(guān)聯(lián)關(guān)系

(1)全局主題與子主題。根據(jù)全局主題-主題詞概率分布Z和子主題-主題詞概率分布z,采用JS散度計算主題間的相似度,獲得主題相似度矩陣Smn,如表4所示。根據(jù)2.4節(jié)主題關(guān)聯(lián)強度計算方法,設定主題相似度閾值,獲取全局主題的關(guān)聯(lián)子主題。以全局主題“京津冀文旅產(chǎn)業(yè)協(xié)同發(fā)展”為例,其子主題及前15個高概率主題詞分布如表5所示。

結(jié)合新聞報道時間信息,按年度劃分為2014—2020年7個時間片。對每個時間片內(nèi)的新聞文本進行主題建模,獲的時序主題和子主題。采用JS散度計算相鄰時間片時序主題間的相似度和時間片內(nèi)時序主題與子主題相似度,分別獲得時序主題間的相似度矩陣和時序主題與子主題的相似度矩陣。以全局主題“京津冀文旅產(chǎn)業(yè)協(xié)同發(fā)展”為例,其在不同時間片上的時序主題和時間片上子主題的前15個高概率主題詞分布如表6所示。

3.4.2 主題關(guān)聯(lián)與演化分析

文化旅游產(chǎn)業(yè)建設是京津冀協(xié)同發(fā)展的重要抓手,也是新聞媒體宣傳報道京津冀協(xié)同發(fā)展的重點領域。以“京津冀文旅產(chǎn)業(yè)協(xié)同發(fā)展”主題為例,開展主題關(guān)聯(lián)和演化分析。

(1)整體分析。通過全局主題與子主題關(guān)聯(lián)關(guān)系和前15個高概率主題詞(表5)觀測,從整體來看京津冀三地合理規(guī)劃區(qū)域文化旅游空間布局,打造文化旅游特色產(chǎn)業(yè),發(fā)展集鄉(xiāng)村休閑旅游、景區(qū)生態(tài)旅游、冰雪體育旅游、休閑購物旅游、濱海休閑旅游和歷史文化古跡旅游等為一體的大旅游產(chǎn)業(yè),全面提升京津冀區(qū)域旅游基礎設施和公共服務水平,培育區(qū)域旅游品牌,實現(xiàn)合作項目共建共享。

(2)局部分析。通過時序主題關(guān)聯(lián)關(guān)系和前15個高概率主題詞(表6)觀測,2014—2017年京津冀文化旅游產(chǎn)業(yè)與生態(tài)環(huán)境、城市規(guī)劃等聯(lián)系較為緊密,而到2018—2020年則演變成與區(qū)域交通一體化、北京冬奧會等主題關(guān)聯(lián)更加密切。通過時間片內(nèi)子主題主題詞分布觀測,進行如下分析。

表6 時序主題與子主題的關(guān)聯(lián)關(guān)系(2014—2020)

一是京津冀生態(tài)環(huán)境的改善提升文化旅游產(chǎn)業(yè)品質(zhì)。文化、旅游、生態(tài)有著密不可分的聯(lián)系,生態(tài)環(huán)境與文化旅游產(chǎn)業(yè)互相依存、互動發(fā)展。京津冀協(xié)同發(fā)展上升為國家戰(zhàn)略初期,京津冀區(qū)域生態(tài)環(huán)境破壞較為嚴重,尤其是大氣污染、水資源惡化更為突出。從2014—2017年4個時間片主題分布看,京津冀三地重點優(yōu)先開展生態(tài)環(huán)境綜合治理,促進了區(qū)域文化旅游產(chǎn)業(yè)的快速發(fā)展,實現(xiàn)了生態(tài)環(huán)境與文化旅游的深度融合。

二是京津冀交通一體化帶動文化旅游產(chǎn)業(yè)快速發(fā)展。從2018—2020年3個時間片主題分布看,文化旅游產(chǎn)業(yè)與交通一體化關(guān)聯(lián)更加緊密。發(fā)展交通是旅游業(yè)壯大的先決條件,“十三五”期間大興國際機場的建成,加速了京津冀區(qū)域和全世界的連接;京張高鐵、京雄高鐵等骨干城際鐵路的啟用,環(huán)首都一小時交通圈逐步擴大;多條高速貫通,促進京津冀三地人流、物流、信息流的流動;京津冀區(qū)域公交省際化、省際公交化實現(xiàn)了城鄉(xiāng)、景區(qū)、場館之間的互聯(lián)互通。可見,交通先行戰(zhàn)略為區(qū)域文化旅游一體化由藍圖變?yōu)楝F(xiàn)實提供了最強有力的支撐。

三是聚焦重大戰(zhàn)略任務協(xié)同推進文化旅游實現(xiàn)新突破。從2014—2020年各個時間片子主題分布看,冬奧會、大運河、長城等成為文化旅游產(chǎn)業(yè)發(fā)展的熱門詞匯。以2022年冬奧會為契機,充分發(fā)揮京北水源涵養(yǎng)功能區(qū)、生態(tài)環(huán)境支撐區(qū)的作用,建設以冰雪運動基地、滑雪度假小鎮(zhèn)為支撐的冰雪主題旅游度假區(qū),推動區(qū)域文化旅游產(chǎn)業(yè)邁出新步伐。區(qū)域協(xié)同推動長城、大運河國家文化公園建設,深入挖掘長城、大運河歷史文化資源,整合旅游觀光線路,提升區(qū)域文化旅游產(chǎn)業(yè)品質(zhì)。

通過與2020—2021年發(fā)布的“京津冀文化和旅游協(xié)同發(fā)展工作要點”進行比較,采用的基于時序主題關(guān)聯(lián)演化的報紙新聞文本分析結(jié)果與政府制定的相關(guān)政策的主要內(nèi)容相吻合,進一步驗證了方法的有效性。

4 結(jié)論

以2014—2020年中國主流報紙媒體有關(guān)京津冀協(xié)同發(fā)展的147 299篇新聞文本為研究對象,采用數(shù)理統(tǒng)計、文獻計量和基于時序主題關(guān)聯(lián)關(guān)系演化等研究方法進行數(shù)據(jù)分析,得到如下結(jié)論。

(1)京津冀協(xié)同發(fā)展上升為國家戰(zhàn)略以來,中國主流報紙媒體圍繞京津冀協(xié)同發(fā)展的報道,按時間趨勢劃分為快速提升(2014)、持續(xù)高潮期(2015—2017)、平穩(wěn)發(fā)展(2018—2019)和逐步衰退(2020年)4個階段,并依據(jù)文獻計量領域的布拉德福定律確定了報道京津冀協(xié)同發(fā)展領域的核心報紙群。

(2)基于LDA主題建模,采用基于困惑度和主題相似度相結(jié)合的指標確定主題的最優(yōu)數(shù)目,挖掘京津冀協(xié)同發(fā)展主流報紙媒體報道的十大主題類分布,計算出各主題類的主題強度,通過主題詞分布對主題類進行了分類分析。

(3)采用基于時序主題關(guān)聯(lián)演化分析方法,按年度劃分時間片,獲取時序主題和子主題的關(guān)聯(lián)關(guān)系。以“京津冀文旅產(chǎn)業(yè)協(xié)同發(fā)展”主題為例,通過全局主題、時序主題與子主題的關(guān)聯(lián)關(guān)系,對文化旅游產(chǎn)業(yè)的主題演化關(guān)系進行了分析,進而驗證了所采用信息分析方法的有效性。

綜上所述,研究結(jié)果對深化國家戰(zhàn)略政策新聞文本內(nèi)容分析、把握政策事件發(fā)展的特點與規(guī)律,對于政府決策和管理,提供理論參考和依據(jù)。重點圍繞“京津冀文旅產(chǎn)業(yè)協(xié)同發(fā)展”主題開展了主題內(nèi)容和演化分析,在后續(xù)的工作中還需要開展其他主題的深入研究。

猜你喜歡
關(guān)聯(lián)旅游模型
一半模型
“苦”的關(guān)聯(lián)
當代陜西(2021年17期)2021-11-06 03:21:36
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
奇趣搭配
智趣
讀者(2017年5期)2017-02-15 18:04:18
旅游
3D打印中的模型分割與打包
旅游的最后一天
出國旅游的42個表達
海外英語(2013年8期)2013-11-22 09:16:04
主站蜘蛛池模板: 女人av社区男人的天堂| 无遮挡国产高潮视频免费观看| 日韩欧美91| 亚洲天堂视频在线观看免费| 精品久久久无码专区中文字幕| 精品色综合| 国产成人无码久久久久毛片| 久久精品无码国产一区二区三区| 国产一级视频在线观看网站| AV网站中文| 色婷婷电影网| 欧美色视频网站| 波多野结衣亚洲一区| 国产精品成人不卡在线观看| 国产精品漂亮美女在线观看| 久青草国产高清在线视频| 久久青草免费91线频观看不卡| 亚洲国产精品一区二区第一页免 | 亚洲欧美不卡中文字幕| 欧美亚洲另类在线观看| 国产欧美视频在线| 亚洲av综合网| 国产青榴视频| 精品国产免费观看一区| 亚洲精品777| 99成人在线观看| 国产精品人成在线播放| 亚洲精品高清视频| 国产精品久久久久久久久久久久| 国产成人三级在线观看视频| 毛片免费在线视频| 18黑白丝水手服自慰喷水网站| 97青草最新免费精品视频| 久久久精品国产SM调教网站| 91青青草视频| 青青草原国产精品啪啪视频| 72种姿势欧美久久久大黄蕉| 国产欧美日韩综合在线第一 | 亚洲国产系列| 一级成人a做片免费| 中文字幕欧美日韩| 99在线视频免费观看| 中国成人在线视频| 超清无码熟妇人妻AV在线绿巨人| 91精品小视频| 国产91透明丝袜美腿在线| 亚洲欧美日韩视频一区| 亚洲日韩AV无码一区二区三区人| 国产91无毒不卡在线观看| 婷婷午夜影院| 日韩在线成年视频人网站观看| 免费人成在线观看视频色| 亚洲欧洲自拍拍偷午夜色| 国产伦片中文免费观看| 亚洲天堂免费观看| 久久精品亚洲专区| 色综合热无码热国产| 国产成人超碰无码| 一级全免费视频播放| 久久狠狠色噜噜狠狠狠狠97视色| 老司机精品99在线播放| 好紧好深好大乳无码中文字幕| 精品无码一区二区在线观看| 欧美成人aⅴ| 免费a在线观看播放| 国产91丝袜在线播放动漫| 久久久久青草线综合超碰| 四虎国产永久在线观看| 在线观看热码亚洲av每日更新| 国产成人久视频免费| 日韩a级毛片| 男女精品视频| 久久国产乱子伦视频无卡顿| 亚洲人成在线精品| 国产一在线| 狠狠v日韩v欧美v| 国产欧美专区在线观看| 欧日韩在线不卡视频| 韩日无码在线不卡| 亚洲视频二| 国产69精品久久久久孕妇大杂乱| 亚洲黄色视频在线观看一区|