999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

識(shí)別網(wǎng)絡(luò)新聞標(biāo)題黨

2018-02-26 20:41:54張曉春
文學(xué)教育 2018年2期

張曉春

內(nèi)容摘要:隨著網(wǎng)絡(luò)的迅猛發(fā)展和媒體競(jìng)爭(zhēng)的加劇以及市場(chǎng)化步伐的加快,“標(biāo)題黨”成為一個(gè)越來越突出的現(xiàn)象。不少“標(biāo)題黨”為了提煉成“語(yǔ)不驚人死不休”的標(biāo)題,不惜斷章取義、張冠李戴甚至歪曲事實(shí),危害極大。本文首先對(duì)標(biāo)題黨做了解釋,然后根據(jù)目前網(wǎng)絡(luò)新聞標(biāo)題存在的問題提出識(shí)別標(biāo)題黨的必要性,接著對(duì)識(shí)別網(wǎng)絡(luò)新聞標(biāo)題黨的主要技術(shù)做了簡(jiǎn)要分析和比較,指出存在的不足之處,最后提出了一些自己的建議。

關(guān)鍵詞:標(biāo)題黨 網(wǎng)絡(luò)新聞 識(shí)別技術(shù) 方法介紹

我們通常認(rèn)為,在網(wǎng)絡(luò)上,一篇新聞報(bào)道要想獲得較高的點(diǎn)擊量,必須有吸引人的標(biāo)題、優(yōu)質(zhì)的內(nèi)容、廣泛的推廣渠道,相比于內(nèi)容和渠道,對(duì)標(biāo)題的再加工無疑是成本最小、收效最大的。隨著網(wǎng)絡(luò)信息的膨脹與快速變化,僅僅為吸引人眼球的標(biāo)題黨談不上任何創(chuàng)新創(chuàng)意,也絕無過人之處,有的只是罔顧事實(shí),誤導(dǎo)輿論。網(wǎng)絡(luò)新聞標(biāo)題黨雖然能夠博人眼球,但是卻失去了新聞報(bào)道最重要的功用——保障知情、輿論監(jiān)督、促進(jìn)公正,對(duì)于新聞?shì)浾摰墓帕σ彩菢O大損傷。

本文首先介紹了網(wǎng)絡(luò)新聞標(biāo)題黨出現(xiàn)的原因及其危害,通過對(duì)幾個(gè)典型的標(biāo)題黨新聞的分析來探究標(biāo)題黨新聞識(shí)別技術(shù)的主要目的,介紹當(dāng)前國(guó)內(nèi)主要標(biāo)題黨新聞識(shí)別技術(shù),厘清標(biāo)題黨新聞識(shí)別的主要方法,指出這些方法存在的問題和局限性。最后,針對(duì)如何更好地進(jìn)行標(biāo)題黨新聞識(shí)別提出了一些自己的見解,希望標(biāo)題黨識(shí)別技術(shù)能夠在將來變得更加完善、高效,在一定程度上阻止標(biāo)題黨新聞的傳播,提高受眾者的閱讀品質(zhì)。

一.何為“標(biāo)題黨”

眾所周知,標(biāo)題是新聞的眼睛,在當(dāng)前信息化快速發(fā)展的時(shí)代中,人們接受新聞的方式呈現(xiàn)出多樣性,出現(xiàn)5秒效應(yīng)或者看新聞看題的提法,這種情況下在一定程度上體現(xiàn)出了新聞標(biāo)題的作用。此外,在網(wǎng)絡(luò)新聞中標(biāo)題同樣需要加以關(guān)注,只有如此才能讓快速抓住受眾,完成引導(dǎo)活動(dòng),形成良好閱讀,換而言之,現(xiàn)階段網(wǎng)絡(luò)新聞的競(jìng)爭(zhēng)主要體現(xiàn)在網(wǎng)絡(luò)新聞標(biāo)題的競(jìng)爭(zhēng)之上。

《現(xiàn)代漢語(yǔ)詞典》(第六版)中并沒有收錄“標(biāo)題黨”這一詞條。一般認(rèn)為,“標(biāo)題黨”是發(fā)端于網(wǎng)絡(luò)論壇,發(fā)帖者為吸引人氣,提高帖子的點(diǎn)擊量而制作博人眼球標(biāo)題的網(wǎng)絡(luò)貼主群體或行為。“標(biāo)題黨”可以說是這樣一些信息發(fā)布和轉(zhuǎn)發(fā)行為、人群的總稱。“標(biāo)題黨”的目的不是為傳播信息本身,而是為了引起關(guān)注,獲取更多的經(jīng)濟(jì)利益。網(wǎng)編們?yōu)榱嗽诤A康男畔⒅挟愜娡黄穑@取點(diǎn)擊率,爭(zhēng)取到好的排位,有更多的廣告收益,紛紛仿效廣告業(yè)“標(biāo)題黨”的手法將大量新聞標(biāo)題重新包裝,挖空心思“嘩眾取寵”,大量“題不對(duì)文”的新聞標(biāo)題就此出籠。從特點(diǎn)上分析,標(biāo)題黨具有兩個(gè)特征,第一是夸大性:主要是對(duì)文章內(nèi)容進(jìn)行夸大,以此起到吸引受眾眼球的作用;第二是作假型:標(biāo)題與文章的內(nèi)容有所差別,內(nèi)容描述的是另外一個(gè)事實(shí),但是為了提高受眾的注意力,則將標(biāo)題設(shè)定為其它內(nèi)容,起到吸引的作用。無論哪一個(gè)特點(diǎn),均在一定程度上反映出了標(biāo)題黨這種現(xiàn)象沒有遵循新聞的實(shí)際情況,也沒有符合新聞發(fā)展的要求,長(zhǎng)此久往則會(huì)導(dǎo)致新聞呈現(xiàn)出缺陷與不足,甚至在新時(shí)期讓人們對(duì)新聞形成不良情緒。

二.標(biāo)題黨新聞識(shí)別的必要性

原標(biāo)題:“大胸”比“平胸”更易患乳癌

記者獲悉,中國(guó)女性超過一半是致密性乳腺,患乳腺癌的風(fēng)險(xiǎn)比脂肪性乳腺高4.7倍,而且,密集的腺體易掩蓋早期癌癥病癥。這是因?yàn)椋瑏喼夼缘娜榉肯鄬?duì)較小,且以致密性乳房為主。以致密性乳腺為主的亞洲女性,如果只用手動(dòng)超聲做為第一線做乳腺癌篩查,可能會(huì)存在一定的漏診。

析因:超過50%的中國(guó)女性是致密性乳腺

在中國(guó),超過50%的女性具有致密性乳腺。擁有致密性乳腺的女性,相對(duì)于脂肪性乳腺的女性,罹患乳腺癌的風(fēng)險(xiǎn)高4.7倍。(節(jié)選)

這種新聞就是典型的“標(biāo)題黨”!全篇新聞沒有一次出現(xiàn)“大胸”、“平胸”,但在標(biāo)題中卻出現(xiàn)了“‘大胸比‘平胸更容易患乳腺癌”的結(jié)論,簡(jiǎn)直是驚為天人。本來一個(gè)“中規(guī)中矩”的標(biāo)題,在他們手下,就變了大樣。“標(biāo)題黨”抓住人們“掃視”新聞的這一心理,誤導(dǎo)大眾,不明事實(shí)真相的“吃瓜群眾”將這種不經(jīng)過大腦分析的消息通過網(wǎng)絡(luò)傳播給他人,以訛傳訛,謠言就產(chǎn)生了。從另外一個(gè)角度分析,如果這種文章傳輸給受眾,則會(huì)讓受眾無法辨別其真實(shí)性,甚至還會(huì)產(chǎn)生抵觸心理,嚴(yán)重影響了新聞的真實(shí)性以及全面性。除此之外,在當(dāng)前的發(fā)展背景下,需要清楚的認(rèn)識(shí)到標(biāo)題黨所帶來的影響,并且能夠從本質(zhì)出發(fā),從新聞識(shí)別的方式出發(fā),對(duì)標(biāo)題黨新聞的識(shí)別方法進(jìn)行對(duì)比與分析,這樣才能真正提高新聞的可行性以及創(chuàng)新性。

三.標(biāo)題黨新聞識(shí)別方法介紹及對(duì)比

1.基于主題句分布的標(biāo)題黨新聞識(shí)別算法

在新聞標(biāo)題與主題內(nèi)容相關(guān)程度研究方面,國(guó)內(nèi)有學(xué)者對(duì)“標(biāo)題黨”類新聞的識(shí)別進(jìn)行了研究,王志超提出中提出了一種基于內(nèi)容主題句相似度的“標(biāo)題黨”新聞識(shí)別方法:首先從正文中提取出可能反映正文主題的句子集合,再分別計(jì)算它們與標(biāo)題的相似度,并以最大相似度作為評(píng)價(jià)參數(shù)。這種方法歸根到底是網(wǎng)頁(yè)信息抽取→主題句提取→句子相似度計(jì)算。但這個(gè)方法對(duì)于“以偏概全”的新聞難以達(dá)到較好的識(shí)別作用。它對(duì)一些同義詞以及未登錄詞、專有名詞無法很好地識(shí)別。比如林俊杰演唱會(huì)的報(bào)道中同時(shí)出現(xiàn)“林俊杰”和“JJ”,他們是一個(gè)人,但是基于主題句的識(shí)別方法認(rèn)為兩個(gè)詞不相關(guān),句子相似度計(jì)算出現(xiàn)誤差。這種方法終究沒有避免TF-IDF只考慮上下文統(tǒng)計(jì)特性而不考慮語(yǔ)義信息的局限。漢語(yǔ)句子的表達(dá)形式是多種多樣的,如果要準(zhǔn)確地刻畫一個(gè)句子所表達(dá)的意思,還應(yīng)該結(jié)合語(yǔ)法結(jié)構(gòu)信息。所以在進(jìn)行新聞報(bào)道的時(shí)候,需要多角度的分析與研究,并且要從本質(zhì)商除法,對(duì)主題句分布的標(biāo)題黨新聞識(shí)別加以重視,如此才能實(shí)現(xiàn)新聞報(bào)道的有效與全面。

2.基于主題詞分布的識(shí)別算法

考慮到主題句識(shí)別算法的短板,又有學(xué)者引入了基于主題詞分布的新聞識(shí)別算法。首先從新聞標(biāo)題中提取出最能反映標(biāo)題中心含義的主題詞。再分析主題詞在新聞?wù)闹械姆植记闆r,最后根據(jù)分布情況計(jì)算出是正常新聞的概率,從而判斷是否為標(biāo)題黨新聞。這個(gè)算法考慮到短語(yǔ)結(jié)構(gòu)分析和依存句法分析,分析句子結(jié)構(gòu)對(duì)主題詞集合K的形成提供了幫助。但是這個(gè)方法也存在一些問題,根據(jù)依存句法所構(gòu)建的24種關(guān)系詞典都可以進(jìn)行二次處理嗎?在對(duì)多名詞短語(yǔ)處理時(shí)如何確定這個(gè)名詞短語(yǔ)是否過濾?endprint

北京飯館老板換大招牌迎接奧運(yùn)

“北京飯館老板”為并列名詞,處理后變?yōu)椋骸袄习鍝Q大招牌迎接奧運(yùn)

萬一作者強(qiáng)調(diào)的重點(diǎn)就是這個(gè)“北京老板”喜迎奧運(yùn)呢?這種情況該如何識(shí)別?

3.基于潛在語(yǔ)義的標(biāo)題黨新聞識(shí)別算法

這種標(biāo)題黨識(shí)別技術(shù)以潛在語(yǔ)義分析算法為理論基礎(chǔ)、以矩陣的奇異值分解為核心。這種方法的優(yōu)點(diǎn)有以下幾點(diǎn):1.可消除無關(guān)詞語(yǔ)的干擾。2.抽取正文簡(jiǎn)單有效。3.從與新聞標(biāo)題相關(guān)的段落數(shù)占總段數(shù)的比值,以及這些段落內(nèi)容總長(zhǎng)度占新聞?wù)目傞L(zhǎng)度的比值兩個(gè)角度對(duì)目標(biāo)新聞內(nèi)容進(jìn)行雙重判定。這種方法有是有明顯的局限性的,(1)網(wǎng)頁(yè)新聞布局結(jié)構(gòu)造成識(shí)別誤差(2)分詞詞典具有局限性,人名、地名、網(wǎng)絡(luò)詞匯等未登錄詞無法正確識(shí)別。

從總體上看,這三種方法都有各自明顯的優(yōu)勢(shì)和缺點(diǎn),如果能將主題詞識(shí)別新聞技術(shù)和潛在語(yǔ)義識(shí)別新聞技術(shù)結(jié)合起來使用,應(yīng)該是很有幫助的。在提取新聞?wù)暮瓦M(jìn)行分詞的過程中我認(rèn)為還有一些問題需要注意:

(1)現(xiàn)在的網(wǎng)頁(yè)不只包含新聞?wù)模W(wǎng)頁(yè)兩邊還會(huì)有廣告,正文下方還會(huì)有“相關(guān)推薦”。這部分信息肯定會(huì)干擾關(guān)鍵詞的識(shí)別,那該如何篩除這部分信息?

(2)在對(duì)標(biāo)題、正文進(jìn)行切詞時(shí),應(yīng)該采用多種分詞算法相結(jié)合的方法。如切分“北京大學(xué)生運(yùn)動(dòng)會(huì)今日開幕”這樣的句子,可以使用正、逆向最大匹配方法,得到粒度更細(xì)的分詞結(jié)果。但是雙向最大匹配無法發(fā)現(xiàn)鏈長(zhǎng)為偶數(shù)的交集型歧義,那么可以增加回溯機(jī)制。

(3)分詞詞典是進(jìn)行標(biāo)標(biāo)題識(shí)別不可缺少的部分,未登錄詞、新詞語(yǔ)、方言詞難以識(shí)別是造成識(shí)別率較低的原因之一。建立動(dòng)態(tài)分詞詞典和語(yǔ)料庫(kù)就是我們必須要提上日程的事。同時(shí),現(xiàn)在的新聞標(biāo)題,尤其是網(wǎng)絡(luò)新聞標(biāo)題中大量使用字母詞,對(duì)字母詞的識(shí)別也是我們需要注意的。

(4)在《基于潛在語(yǔ)義分析的標(biāo)題黨新聞識(shí)別技術(shù)研究》中,作者使用了基于詞頻統(tǒng)計(jì)的方式。但是,僅僅考慮新聞的分詞單位和段落之間的關(guān)系是不夠的,還需要了解分詞單位與其上下文之間的關(guān)系。這時(shí)可以利用TF·IDF算法來計(jì)算各單位對(duì)于各個(gè)段落的重要程度。所以無論從哪一個(gè)角度分析,均可以清楚的認(rèn)識(shí)到在網(wǎng)絡(luò)新聞標(biāo)題是十分關(guān)鍵的,需要多加關(guān)注與研究,加強(qiáng)分析與研究,避免出現(xiàn)標(biāo)題黨現(xiàn)象的發(fā)生。

總而言之,在當(dāng)前時(shí)代的不斷發(fā)展下,網(wǎng)絡(luò)新聞標(biāo)題語(yǔ)中存在很多不規(guī)范的地方。這些不規(guī)范的現(xiàn)象產(chǎn)生了許多消極的影響,嚴(yán)重破壞了語(yǔ)言的純潔性,尤其是標(biāo)題黨的出現(xiàn),沒有遵循新聞的基本要求,也沒有從本質(zhì)出發(fā),實(shí)現(xiàn)新聞傳播的有效性,故此本文通過對(duì)網(wǎng)絡(luò)新聞標(biāo)題黨識(shí)別算法進(jìn)行簡(jiǎn)單分析和比較,對(duì)網(wǎng)絡(luò)新聞標(biāo)題的識(shí)別情況有一個(gè)整體性的了解和認(rèn)識(shí),發(fā)現(xiàn)了新聞標(biāo)題黨識(shí)別技術(shù)在使用上存在的一些問題,并提出相關(guān)的意見和建議。雖然現(xiàn)在已經(jīng)出現(xiàn)多種識(shí)別網(wǎng)絡(luò)新聞標(biāo)題黨識(shí)別的技術(shù),但是它們都存在或多或少的問題,對(duì)于這方面的研究還需要繼續(xù)深入,我們能做的還有很多。

參考文獻(xiàn)

[1]王志超,翁楠,王宇.基于主題句相似度的標(biāo)題黨新聞鑒別技術(shù)研究[J].北京:現(xiàn)代圖書情報(bào)技術(shù),2011,(11):48-53.

[2]朱青,李貞昊.基于主題詞分布的低價(jià)值新聞識(shí)別技術(shù)研究[J].上海:計(jì)算機(jī)應(yīng)用與軟件,2015,(7):190-195.

[3]羅佳.基于潛在語(yǔ)義分析的標(biāo)題黨新聞識(shí)別技術(shù)研究[J].武漢:湖北工業(yè)大學(xué)碩士論文,2015年6月.

[4]常鵬,馬輝.高效的短文本主題詞抽取方法[J].北京:計(jì)算工程與應(yīng)用,

(作者單位:廈門大學(xué)人文學(xué)院中文系)endprint

主站蜘蛛池模板: 亚洲福利片无码最新在线播放 | 欧美日韩国产精品综合| 91福利免费| 岛国精品一区免费视频在线观看| Jizz国产色系免费| 亚洲欧美在线看片AI| 国产福利微拍精品一区二区| 又爽又黄又无遮挡网站| 亚洲日本www| 国产拍揄自揄精品视频网站| 亚洲乱码视频| 亚洲三级色| 2020最新国产精品视频| 四虎精品黑人视频| 毛片网站在线看| 国产在线拍偷自揄观看视频网站| 国产精品福利社| 欧美日韩第二页| 亚洲无码在线午夜电影| 国产精欧美一区二区三区| 亚洲午夜福利精品无码| 久久男人资源站| 91麻豆精品国产高清在线| h视频在线观看网站| 一级成人a毛片免费播放| 欧美亚洲一二三区| 成人a免费α片在线视频网站| 在线无码九区| 新SSS无码手机在线观看| 亚洲精品图区| yjizz国产在线视频网| 亚洲综合精品香蕉久久网| 韩日免费小视频| 亚洲精品久综合蜜| 99在线视频精品| 五月天香蕉视频国产亚| 亚洲成人精品久久| 欧美一级黄片一区2区| 99久视频| 亚洲无线一二三四区男男| 欧美国产综合视频| 国产亚洲欧美另类一区二区| 国产白浆在线| 国产精品嫩草影院视频| 亚洲人成成无码网WWW| 亚洲色无码专线精品观看| www.日韩三级| 91福利一区二区三区| 欧美日本在线观看| 国产精品播放| 91系列在线观看| 久久99精品久久久久纯品| 国产综合日韩另类一区二区| 国产成人乱无码视频| 97久久免费视频| 婷婷六月在线| 国产毛片不卡| 成人福利一区二区视频在线| 欧美日韩v| 欧美激情二区三区| 91久草视频| 亚洲男人的天堂在线观看| 亚洲永久色| 五月婷婷综合网| 看国产毛片| 看av免费毛片手机播放| 欧美成人日韩| 高清国产在线| 五月婷婷欧美| 无码精油按摩潮喷在线播放| 亚洲国产精品国自产拍A| 国产福利在线免费| 国产免费看久久久| 亚洲精品天堂在线观看| 国产成人精品综合| 欧类av怡春院| av免费在线观看美女叉开腿| 国产精品免费露脸视频| 国产精品七七在线播放| 亚洲swag精品自拍一区| 成人伊人色一区二区三区| 国产欧美日韩视频一区二区三区|