999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

政策解讀大數(shù)據(jù)分析應(yīng)用的實(shí)踐探究

2019-04-29 06:06:18譚辛
中國(guó)傳媒科技 2019年3期
關(guān)鍵詞:多維度分類(lèi)文本

文/譚辛

引言

每年國(guó)家各級(jí)政府部門(mén)都有大量的政策發(fā)布,政策內(nèi)容涉及到社會(huì)發(fā)展和民生的方方面面,因此每項(xiàng)新政發(fā)布都備受關(guān)注。政策發(fā)布的目的是什么,如何詳細(xì)解讀政策,政策發(fā)布后哪些行業(yè)領(lǐng)域受到怎樣的影響,在政策以及解讀已成為媒體界、企業(yè)界、學(xué)術(shù)界,以及普通百姓等社會(huì)各方關(guān)注的焦點(diǎn)。如何快速和全面地收集和分析政策及解讀數(shù)據(jù)具有現(xiàn)實(shí)的意義。

本文介紹通過(guò)自動(dòng)化的網(wǎng)絡(luò)信息抓取技術(shù)、大數(shù)據(jù)技術(shù)和文本智能挖掘技術(shù),快速高效地匯聚最新政策和政策解讀信息,并在此基礎(chǔ)上進(jìn)行政策關(guān)鍵要素信息提取、數(shù)據(jù)多維度分類(lèi)、數(shù)據(jù)關(guān)聯(lián)等加工處理,從而形成一套政策解讀的數(shù)據(jù)產(chǎn)品,為媒體從業(yè)者、行業(yè)研究人員、企業(yè)界提供多場(chǎng)景和多角色的信息服務(wù),提升信息獲取和數(shù)據(jù)研究的工作效率。

1.政策信息獲取難點(diǎn)

各行業(yè)對(duì)最新政策信息獲取具有較高的需求和要求。對(duì)于媒體行業(yè),需要第一時(shí)間獲取到政策發(fā)布信息,并針對(duì)新政撰寫(xiě)宣傳報(bào)道或解讀性文章,稿件發(fā)布的時(shí)效性體現(xiàn)并影響著媒體的傳播力和影響力;對(duì)于企業(yè)而言,需要及時(shí)研究新政對(duì)企業(yè)發(fā)展、研發(fā)投入、市場(chǎng)變化、決策分析等方面帶來(lái)的影響而制定企業(yè)內(nèi)部策略,很多政策的發(fā)布對(duì)企業(yè)發(fā)展方向有著至關(guān)重要的影響。但政策信息來(lái)源廣泛、發(fā)布時(shí)間不集中、信息有待關(guān)聯(lián)整合等制約了政策信息的獲取。

1.1 政策數(shù)據(jù)來(lái)源廣泛

政策發(fā)布均來(lái)自各級(jí)政府部門(mén),對(duì)于個(gè)人查詢政策信息的難度在于來(lái)源廣泛的問(wèn)題。首先,權(quán)威的政策查詢?cè)搭^為政府部門(mén)的官方網(wǎng)站、官方新聞客戶端、官方微信公眾號(hào)和官方認(rèn)證微博,發(fā)布源頭類(lèi)型較多;其次,政府部門(mén)按級(jí)別、按部門(mén)類(lèi)型,數(shù)量較為龐大,即便僅關(guān)注單一領(lǐng)域的政策,也需要關(guān)注多個(gè)政府官方信息發(fā)布源頭;再次,對(duì)于政策發(fā)布后的政策解讀文章,除了政府官方網(wǎng)站的官方解讀文章外,政府部門(mén)官員、領(lǐng)域內(nèi)專(zhuān)家學(xué)者、研究機(jī)構(gòu)的研究人員、媒體業(yè)專(zhuān)家等撰寫(xiě)的解讀文章也具有非常高的閱讀價(jià)值,但是這些來(lái)源更為廣泛,可能來(lái)自比如新聞門(mén)戶網(wǎng)站、新聞客戶端、報(bào)紙或紙媒電子報(bào)、機(jī)構(gòu)的微信公眾號(hào)或微博、領(lǐng)域內(nèi)專(zhuān)家學(xué)者個(gè)人的博客、公眾號(hào)或微博等。總之,想要快速瀏覽到各方發(fā)表的政策解讀信息存在一定困難。

1.2 發(fā)布時(shí)間不一

每年發(fā)布的政策中,只有很少一部分是在固定時(shí)間段內(nèi)發(fā)布,另外的大部分都是根據(jù)社會(huì)發(fā)展需要而實(shí)時(shí)推出的,無(wú)法提前準(zhǔn)備政策信息獲取工作。

綜上所述,在信息過(guò)載的當(dāng)下,如何快速高效獲取政策和解讀信息,如何精準(zhǔn)獲取各行業(yè)研究人員需要的數(shù)據(jù),如何借助人工智能和機(jī)器分析能力匯聚分析信息為研究人員服務(wù),成為政策解讀應(yīng)用需要解決的關(guān)鍵問(wèn)題。

2.政策解讀大數(shù)據(jù)分析的應(yīng)用實(shí)踐

政策解讀應(yīng)用借助大數(shù)據(jù)和人工智能技術(shù),實(shí)現(xiàn)了自動(dòng)化的信息采集、多維度的自動(dòng)標(biāo)引、文本挖掘和關(guān)聯(lián)分析,通過(guò)可視化的展示提升了政策及政策解讀信息的使用效率。

2.1 自動(dòng)化監(jiān)測(cè)采集

通過(guò)借助成熟的自動(dòng)化網(wǎng)絡(luò)信息抓取軟件,實(shí)現(xiàn)對(duì)政策和解讀信息發(fā)布源頭目標(biāo)網(wǎng)站做實(shí)時(shí)監(jiān)控,把最新的網(wǎng)頁(yè)及時(shí)采集到本地,進(jìn)行內(nèi)容分析和信息過(guò)濾等流程,完成政策解讀信息本地存儲(chǔ)。

數(shù)據(jù)采集過(guò)程中,應(yīng)用不僅將網(wǎng)頁(yè)的非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)變成半結(jié)構(gòu)化數(shù)據(jù),同時(shí)自動(dòng)提取政策名稱(chēng)、發(fā)布時(shí)間、政策文本內(nèi)容,以及發(fā)文單位名稱(chēng)、發(fā)布網(wǎng)站名稱(chēng)、頻道名稱(chēng)、發(fā)文鏈接地址等政策相關(guān)數(shù)據(jù)。后續(xù)進(jìn)行的文本挖掘和加工處理,構(gòu)建了政策元數(shù)據(jù)數(shù)據(jù)庫(kù),為政策解讀應(yīng)用提供基礎(chǔ)數(shù)據(jù)服務(wù)。

采集源頭主要面向一手發(fā)布數(shù)據(jù)源,而非經(jīng)過(guò)轉(zhuǎn)載后的二手?jǐn)?shù)據(jù),以保證信息獲取的及時(shí)性、準(zhǔn)確性和可靠性。

2.2 政策和解讀信息加工處理

數(shù)據(jù)采集技術(shù),對(duì)最新網(wǎng)絡(luò)數(shù)據(jù)實(shí)時(shí)監(jiān)控采集,解放個(gè)人瀏覽和搜索時(shí)間。文本挖掘技術(shù),提供信息自動(dòng)化分類(lèi)、自動(dòng)聚類(lèi)、智能化信息提取、數(shù)據(jù)關(guān)聯(lián)分析和數(shù)據(jù)自動(dòng)標(biāo)引等一系列數(shù)據(jù)加工處理,解決政策數(shù)據(jù)孤島問(wèn)題,讓政策數(shù)據(jù)應(yīng)用更加有效。圖1為政策及解讀數(shù)據(jù)加工處理流程圖。

圖1 數(shù)據(jù)加工處理流程圖

2.3 多維度分類(lèi)標(biāo)引

采用自動(dòng)分類(lèi)和規(guī)則分類(lèi)技術(shù),對(duì)政策做多維度分類(lèi)標(biāo)引,用以幫助不同身份用戶在不同需求場(chǎng)景下更加快速、有針對(duì)性地查找到所需類(lèi)目和對(duì)應(yīng)的政策信息。包括政策所屬行業(yè)領(lǐng)域、所屬地域名稱(chēng)、發(fā)布單位名稱(chēng)、所屬主題名稱(chēng)、發(fā)文形式、所屬年份等分類(lèi)標(biāo)簽。分類(lèi)類(lèi)別舉例如表1所示。

表1 政策分類(lèi)名稱(chēng)和分類(lèi)值舉例

在前端應(yīng)用功能中,利用這些政策標(biāo)簽,采用細(xì)分導(dǎo)航的方式,進(jìn)行政策列表展示。通過(guò)組合式的檢索功能對(duì)政策和解讀文章進(jìn)行搜索,讓用戶可以通過(guò)自定義關(guān)鍵詞的方式獲取個(gè)性化的檢索結(jié)果,達(dá)到快速、全面了解信息的目的。對(duì)政策和解讀文章的標(biāo)題、正文和主題提供全文檢索功能。對(duì)政策的發(fā)布單位名稱(chēng)、發(fā)文形式、所屬行業(yè)領(lǐng)域、所屬地域、發(fā)布年份等字段,提供篩選功能。多維度分類(lèi)標(biāo)簽,也讓頁(yè)面篩選更為靈活,為個(gè)性化訂閱提供基礎(chǔ)選項(xiàng)。

2.4 政策文本挖掘

對(duì)政策文本做數(shù)據(jù)挖掘和關(guān)鍵信息提取,是政策索引和檢索、信息關(guān)聯(lián)分析、多維度分類(lèi)標(biāo)引等數(shù)據(jù)加工的基礎(chǔ)。采用文本自動(dòng)分詞和詞性標(biāo)注等自然語(yǔ)言處理技術(shù),基于規(guī)則與統(tǒng)計(jì)相結(jié)合的方式,將政策文本進(jìn)行中文分詞以及政策信息提取,包括政策主題關(guān)鍵詞、相關(guān)人物、機(jī)構(gòu)、地區(qū)名稱(chēng)等信息的結(jié)構(gòu)化提取,完成政策的關(guān)鍵詞和實(shí)體標(biāo)引。

在政策信息展示功能中,通過(guò)多維度的智能分析與關(guān)聯(lián),幫助用戶快速地發(fā)現(xiàn)該政策中的關(guān)鍵信息以及關(guān)聯(lián)文章。以圖表化形式,展示政策主題詞、政策主體挖掘結(jié)果(相關(guān)人物、相關(guān)機(jī)構(gòu)、相關(guān)地區(qū))、政策解讀文章時(shí)間發(fā)布趨勢(shì)和數(shù)量;以文章標(biāo)題列表方式,展示相關(guān)政策、相關(guān)解讀文章、相關(guān)媒體報(bào)道文章。展現(xiàn)結(jié)果示意圖如圖2所示。

圖2 政策挖掘結(jié)果展示圖

快速挖掘多方觀點(diǎn),對(duì)多方觀點(diǎn)進(jìn)行對(duì)比展示,可以使用戶更全面地把握政策內(nèi)容。利用語(yǔ)義分析技術(shù),把多文章之間的相關(guān)度超過(guò)一定閾值的文章關(guān)聯(lián)到一起,實(shí)現(xiàn)復(fù)雜語(yǔ)義關(guān)系的深度挖掘,從而完成政策與官方解讀文章、媒體解讀文章、相關(guān)報(bào)道文章、往年政策等進(jìn)行相互關(guān)聯(lián)分析。通過(guò)數(shù)據(jù)挖掘工具對(duì)政策和解讀文章加以處理,抽取各方觀點(diǎn)句與觀點(diǎn)評(píng)價(jià)對(duì)象,再對(duì)抽取結(jié)果進(jìn)行綜合性分析,得到觀點(diǎn)分析的結(jié)果。

2.5 可視化展示

良好的數(shù)據(jù)呈現(xiàn)方式,對(duì)于用戶體驗(yàn)至關(guān)重要。政策解讀數(shù)據(jù)產(chǎn)品終端服務(wù)界面,采用多種瀏覽方式實(shí)現(xiàn)功能和數(shù)據(jù)的展示,來(lái)提升用戶的閱讀興趣和數(shù)據(jù)可讀性。

采用分類(lèi)導(dǎo)航和文章列表相結(jié)合的方式,幫助用戶直觀、快速和全面地獲取信息,提升工作效率。政策畫(huà)像功能,采用統(tǒng)計(jì)圖形化方式,對(duì)個(gè)性化制定時(shí)間段內(nèi)的政策進(jìn)行多種圖形展示,掌握政策在主題、行業(yè)領(lǐng)域、地區(qū)、發(fā)布機(jī)構(gòu)等全貌。數(shù)據(jù)新聞是一種用圖形化的方式來(lái)解讀新聞的創(chuàng)新形式,應(yīng)用在政策的解讀上面也有非常好的效果,可以大大提升用戶瀏覽的興趣度和理解度。圖解政策尤其對(duì)難以理解的政策內(nèi)容,或者篇幅較長(zhǎng)的政策,更能顯示其優(yōu)勢(shì)。

對(duì)于需要長(zhǎng)期關(guān)注的政策類(lèi)型,用戶可以設(shè)置個(gè)性化政策專(zhuān)題,可以訂閱所關(guān)注的行業(yè)、區(qū)域和主題的政策,對(duì)于沒(méi)加入訂閱的政策內(nèi)容不做展示,做到簡(jiǎn)化界面和數(shù)據(jù)篩選。

3.展望

目前,政策解讀大數(shù)據(jù)分析應(yīng)用已經(jīng)上線為編輯記者提供服務(wù),通過(guò)大數(shù)據(jù)聚類(lèi)和分析、組合檢索、政策畫(huà)像、統(tǒng)計(jì)比對(duì)的功能,讓用戶快速、全面和高效地獲取所關(guān)注的政策和解讀信息。通過(guò)HTML5、統(tǒng)計(jì)圖表、圖解等方式,提升用戶閱讀效率。通過(guò)政策專(zhuān)題、個(gè)性化訂閱等方式,將用戶關(guān)注的要點(diǎn)進(jìn)行固化,提升效率。政策信息獲取和基礎(chǔ)分析部分工作提效明顯,使用戶擺脫了繁瑣的篩選工作,拓寬記者報(bào)道的維度和視野,以便有更多精力和時(shí)間投入到內(nèi)容品質(zhì)提升上面。

下一步,該服務(wù)將在融媒體技術(shù)和平臺(tái)基礎(chǔ)上結(jié)合媒體的優(yōu)勢(shì),在信息精選和數(shù)據(jù)加工上下功夫,在內(nèi)容生產(chǎn)與用戶個(gè)性化需求之間實(shí)現(xiàn)智能匹配,探索數(shù)據(jù)增值和基于大數(shù)據(jù)技術(shù)提供數(shù)據(jù)增值服務(wù)的運(yùn)營(yíng)產(chǎn)品。

猜你喜歡
多維度分類(lèi)文本
分類(lèi)算一算
“多維度評(píng)改”方法初探
在808DA上文本顯示的改善
分類(lèi)討論求坐標(biāo)
基于doc2vec和TF-IDF的相似文本識(shí)別
電子制作(2018年18期)2018-11-14 01:48:06
數(shù)據(jù)分析中的分類(lèi)討論
教你一招:數(shù)的分類(lèi)
多維度市南
商周刊(2017年7期)2017-08-22 03:36:22
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學(xué)隱喻
如何快速走進(jìn)文本
主站蜘蛛池模板: 国产美女自慰在线观看| 国产成人精品一区二区三在线观看| 一级毛片基地| 日本手机在线视频| 亚洲AV成人一区国产精品| 无码一区中文字幕| 在线看片国产| 亚洲三级片在线看| 日本成人不卡视频| 好吊色妇女免费视频免费| 国产欧美视频综合二区| 视频一区亚洲| 免费网站成人亚洲| 国产女人18毛片水真多1| www.国产福利| 国产麻豆精品在线观看| 亚洲一区国色天香| 亚洲欧美一区在线| 中文字幕欧美日韩高清| 亚洲天堂免费在线视频| 国模极品一区二区三区| 色呦呦手机在线精品| 国产午夜人做人免费视频中文| 国产乱人伦AV在线A| 久久亚洲国产视频| 国产亚洲欧美日韩在线一区二区三区| 午夜福利无码一区二区| 欧美啪啪视频免码| 在线日韩日本国产亚洲| 天天摸夜夜操| 九九热精品免费视频| 亚洲av成人无码网站在线观看| 91在线播放免费不卡无毒| 98精品全国免费观看视频| 蜜芽一区二区国产精品| 天堂成人av| 久久免费视频6| 91免费国产高清观看| 亚洲精品成人7777在线观看| 91精品国产自产91精品资源| AV在线麻免费观看网站| 一级成人a毛片免费播放| 国产精品欧美日本韩免费一区二区三区不卡 | 亚洲区第一页| 婷婷午夜影院| 日本高清免费一本在线观看| AⅤ色综合久久天堂AV色综合| 伊人久久婷婷五月综合97色| 成人在线不卡视频| 亚洲日韩精品欧美中文字幕| 国产成人福利在线| 亚洲中文字幕在线精品一区| 精品一区二区三区水蜜桃| 97se亚洲综合不卡| 中文字幕亚洲无线码一区女同| 日韩欧美在线观看| 亚洲第一视频网| 综合色区亚洲熟妇在线| a级毛片在线免费| 香港一级毛片免费看| 国产xx在线观看| 影音先锋丝袜制服| 无码AV动漫| 91网址在线播放| 色天天综合| 国产av一码二码三码无码| 欧美一道本| 久视频免费精品6| 国产国产人成免费视频77777| 亚洲熟女偷拍| 欧美福利在线| 国产主播一区二区三区| www.精品国产| 黄色网在线免费观看| 国产精品开放后亚洲| 国产色婷婷| 国产成人精品视频一区视频二区| 欧美一级高清免费a| 老熟妇喷水一区二区三区| 天堂va亚洲va欧美va国产 | 国产无遮挡裸体免费视频| 欧美一级夜夜爽www|