馬逸純 馬森濤 溫惠妮 楊湘穗
摘要:標題在新媒體推文的傳播中發揮著重要作用,因此了解其標題特征對提高推文傳播效果有著十分重要的意義。本文以微信公眾號推文為例,收集了高閱讀量推文的標題文本數據,采用計量統計和定性分析相結合的方法,從標題長度、詞頻、詞性分布、文章閱讀量變化趨勢四個角度對高閱讀量推文標題的特征進行探討,獲得標題長度、詞性分布比例、高頻詞匯組成、不同細分主題標題的特征差異與推文閱讀量之間的關系,以期為優化推文標題提供一些參考。
關鍵詞:微信公眾號;推文標題;語言特點;高閱讀量推文
中圖分類號:G206 文獻標志碼:A 文章編號:1674-8883(2021)12-0019-03
課題項目:本論文為廣東省科技創新戰略專項資金(大學生科技創新培育)項目“高閱讀量公眾號推文標題特征的研究——基于神經網絡詞向量”研究成果,項目編號:pdjh2020b0822
一、引言
在新媒體盛行的時代,微信公眾號作為極具代表性的新媒體形式之一,成為當下信息傳播的主要渠道。與傳統媒體不同的是,讀者在接收新媒體信息時,最先看到的便是文章的標題,它能幫助讀者在大量信息中快速定位自己喜歡的內容[1]。一篇文章是否能夠抓讀者眼球,取決于推送信息的標題能否快速吸引讀者。因此,研究和把握高閱讀量的公眾號推文的標題特征和特點,對發揮新媒體優勢、提升傳播效果、擴大影響力有著重要意義。本文從高閱讀量推文標題的文本要素即標題長度、詞頻、標題詞性結構、閱讀量變化量四個方面對推文標題文本特征進行探討。
二、研究現狀
目前,有關新媒體推文標題的研究多集中在單一主題,如新聞或情感等,其研究視角多為新聞傳播學、句式特點和語言技巧等。例如,楊捷(2018)分析了情感類微信公眾號文章標題的特點,從用詞特點、內容特點和句式特點三方面進行闡釋[2];張丹琪(2020)對新聞媒體編輯微信公眾號新聞標題的語言技巧進行分析[3];李彥迪(2021)基于言語行為理論,分析了人民日報微信公眾號文章標題的言語行為,揭示了文章標題的構成性規則與調節性規則[4]。從上述研究可知,對不同主題的推文標題文本的長度、詞性組成、詞頻分布等形式要素的研究還處于空白。
三、研究方法
(一)樣本選擇
研究標題特征的主要目的是提升推文的傳播效果,因此本文以具有高閱讀量的微信公眾號推文為研究對象。本文定義的高閱讀量推文是指閱讀量進入所在主題的日排行榜前80的推文,以“微小寶”網站的微信推文排行榜為篩選標準。本研究基于自主開發的Python網絡數據抓取工具,收集數據的樣本來自23438個公眾號,742371條推文,共25個主題,總計742371條樣本;收集的時間跨度為2020年5月 27日至2020年7月8日,數據元素包括收集日期、推文標題、所屬公眾號、近24小時閱讀量、近3天閱讀量、近7天閱讀量、近30天閱讀量。
(二)文本預處理
文本預處理主要包括去停用詞、無效的字符和分詞等。其中停用詞主要包括以下幾類:第一,語氣詞,如嗎、否則、吧、吧噠、吱、呀、呃、嘔、唄、嗚、嗚呼等等;第二,介詞,如自從、隨著、當、朝、順、本著、通過、根據、沿著、依照等等;第三,結構助詞,如的、地、得,以及其他沒有實際意義的虛詞和連詞等。無效字符則包括#$%&‘‘()*+,-./:;<>=?[]\^_`{}~。!——丨|“”?…、()《》;:︰【】|「」 ·q④+等符號。分詞處理采用jiebaR開源工具。
四、標題特征
(一)標題長度特征
公眾號推文標題的長度受微信官方平臺規定的64個字符的限制。根據本研究全體樣本的標題字數統計,公眾號推文標題的平均字數為22個,其中標題字數的高頻率區間為12~31個字。這里我們定義高頻率區間是第一四分位(Q1)到第三四分位(Q3)的區間。高頻率區間是標題長度出現得比較集中的區域,其大小可以反映分布離散程度。高頻率區間越大,分布就越離散。
進一步對25個主題的推文標題進行統計分析發現,不同主題的標題長度及其分布也有一定的差異,分別體現在平均長度和標題長度的高頻率區間大小不同。在字數分布上,標題長度大致呈正態分布,但不同主題的離散程度不同。例如,娛樂主題的推文標題長度分布的高頻率區間達16個字寬,而寵物主題的高頻率區間寬度僅為9個字寬,與娛樂主題相差7個字寬,說明娛樂主題的推文標題長度的分布更為離散,涉及的字數較多。
總而言之,不同主題之間標題長度的高頻區間各異。從高頻區間的寬度來看,娛樂、財經、國際、軍事、旅游、時事、社會、家居、美食、汽車、時尚、體育、音樂等13個主題的高頻率區間較寬,而健康養生、教育、科技、母嬰育兒、文化、動漫、搞笑、歷史、星座運勢、情感、游戲、寵物等12個主題的高頻率區間較窄。高頻區間的寬度越窄,此類標題的長度在高頻區間內的浮動越小;而高頻區間較寬的主題標題長度的浮動較大,撰寫標題時對長度把控的靈活性較強。
(二)詞頻
為了更好地研究標題的組成結構,本文對分詞結果進行了同質化合并處理。例如,將具體人名分為領袖人物、娛樂明星、社會名人、體育明星四類。其中領袖人物指古今中外的政界領袖;娛樂明星指著名歌手、演員、模特、網紅、偶像等等;社會名人指著名科學家、經濟學家、文學家、企業家及商界名人等等;體育明星指國內外體育界知名運動員。此外,對數字也進行了同質化合并,記為數字。詞頻定義為該詞出現次數與總詞數之比。本研究分析了25個主題的推文標題詞頻分布,部分主題的分析結果如下表所示。

對25個主題的詞頻進行分析可知,第一,在所有主題的標題中,數字出現的頻率最高,可以反映出公眾號標題關鍵的編輯手法——巧用數字。通過具體數字的運用,可以給讀者傳遞可視化的信息,既增強了文章的真實性、專業性,也能夠贏得讀者的青睞,從而提升文章的閱讀量。第二,從詞頻分布可知,每個主題下都有領袖人物、社會名人出現,并占據較高的比重。標題中含有名人能夠讓讀者在看到標題時產生有自然而然的信賴感,從而提升文章的點擊量。第三,運用熱詞的特征明顯。本文資料收集期間的熱點事件包括中美貿易、疫情等,這些內容既屬于社會事件也屬于時事新聞,備受大眾的關注。因此,相關熱詞也出現在了多個主題的推文標題中,如中國、美國、確診、疫情、病例等熱詞被迅速運用到了標題中。第四,傳統熱點話題也可出現在多個不同主題的推文標題中。不同主題下會出現相同的熱詞,大部分用戶都更傾向于關注輕松娛樂性的熱點話題文章,因此休閑八卦娛樂文章更容易受到歡迎,如國內外名人明星的婚姻狀況一直備受群眾的關注,一旦有任何變動都會得到媒體的報道。
結合以上結論,在標題創作時可以靈活地運用以上特征,以激起用戶的閱讀興趣,從而提高文章的點擊率。詞頻分析表明,微信公眾號推文標題主要由“熱點+數字+領袖名人+相關主題熱詞”等四個要素組成。
(三)標題詞性結構
詞類是可量化考察的語體標記之一,詞類選擇和使用頻率上的差異反映了語體的差異[5]。按照jiebaR的詞類劃分標準,并參考分詞黃伯榮、廖旭東(2013)[6]的詞類劃分標準,本研究將推文標題的分詞庫劃分為11種詞類,并與代表性的傳統媒體如報紙的詞類分布進行了比較分析(見圖1)。

從整體上看,在傳統媒體和公眾號推文標題的分詞占比中,名詞和動詞占比均較高。從分布上看,與報紙相比,公眾號推文標題在占比和次序上均有較大差異。在占比方面,推文標題中的數詞、代詞、副詞和連詞的占比均有大幅提升,而報紙標題中的名詞、動詞、區別詞、介詞、量詞、助詞占比較推文標題有大幅提升。兩者在次序方面也有明顯的變化,推文標題中的代詞、連詞和區別詞的比重次序較傳統媒體有較大提升,而報紙中的介詞、量詞和助詞占比次序較公眾號標題更靠前。傳統媒體的標題的詞性分布更為全面,語法結構更為完善。
在傳統媒體新聞標題的設置中,標題在引人關注的同時更需要注重語句的完整性和事實的還原程度;相比之下,公眾號一類新媒體的推文標題更關注關鍵詞和具有沖擊感的詞匯,如數詞、代詞、副詞等,一定程度上放棄了標題的語法完整性,更加偏向碎片化。在公眾號推文標題中,標題詞性有側重地分布,更強調語句的信息沖擊力和簡短程度,多使用名詞、動詞、數詞和代詞作為標題的詞性組成去撰寫標題。名詞和動詞可以充當任何一種句子成分,并能作為句子的核心成分表達句子含義[8]。名詞和動詞的活用除了可以表達事物本身的含義外,還可以凸顯語意,讓語言變得新穎別致,更具當代新詞語的韻味[9]。代詞和數詞可以用于修飾和限制名詞,“代詞+名詞”“數量詞+名詞”的形式可以比較具體地說明人或事物的性質、狀態、數量、所屬和質料等,從而區別事物之間的不同特征[10]。由此可見,名詞、動詞、數詞和代詞是構成公眾號推文標題的四種主要詞性,受標題長度的限制,可以在一定程度上放棄標題的語法完整性。
(四)閱讀量變化趨勢
為了探究公眾號推文發布后閱讀量變化的趨勢,總結微信公眾號文章標題的傳播效果及文章熱度的時效性,本研究隨機選取8個具有代表性的推文進行了分析。圖2是累計閱讀量隨時間的變化情況。

從圖2中可以發現,在發布推文的前幾天時間內,推文的累計閱讀量增長較快,但達到某一閱讀量后,增長會變緩并逐漸趨向穩定。從數據結果來看,所有推文累計閱讀量在三天內有較大幅度的提升,從第三天開始,增長幅度減小,第七天后其增長幾乎停止。這說明在新媒體領域文章標題傳播效果在發布后的三天時間內效果最佳,文章熱度時效性通常不超過七天。
五、結語
在當下新媒體環境下,標題是整篇推文的“靈魂”和“窗戶”。在微信公眾號推文創作過程中,標題的制作十分重要。本文從標題長度、詞頻、詞類及其分布的視角出發,對微信公眾號推文標題進行了分析,得出四點結論。第一,不同主題之間標題長度及區間分布具有一定差異,如平均標題字數和高頻區間等都有所不同。在撰寫推文標題時,應根據相應的主題,將標題字數控制在對應的區間之內。第二,根據對標題詞匯的研究,可以發現公眾號推文的標題通常由“熱點+數字+領袖名人+相關主題關鍵詞”等四要素組成。在標題創作時可以從這四個要素出發,并根據實際主題對相關要素進行自由組合。第三,公眾號推文標題中標題詞性有側重性地分布,更強調語句的信息沖擊力和簡短程度,名詞、動詞、數詞和代詞是主要使用的詞性。第四,新媒體領域,文章標題傳播效果在發布后的三天時間內效果最佳,并且文章熱度時效性不超過一周。
參考文獻:
[1] 王玲.新媒體新聞標題的重要性探討[J].新聞研究導刊,2020,11(22):175-176.
[2] 楊婕.情感類微信公眾號文章的標題研究[D].湘潭:湘潭大學,2018.
[3] 張丹琪.新聞媒體微信公眾號的新聞標題語言技巧分析[J].傳媒論壇,2020,3(23):39-40.
[4] 李彥迪.言語行為理論下的《人民日報》微信文章標題研究[J].傳媒論壇,2021,4(06):155-157.
[5] 黃伯榮,廖旭東.現代漢語[M].北京:高等教育出版社,2011:158-171.
[6] 胡明揚.現代漢語詞類問題考察[J].中國語文,1995(05):381-389.
[7] 趙雪,顧曉玉.抗戰時期報紙新聞標題語言的計量語體分析 ———以《新華日報》《中央日報》為例[J].理論與現代化,2015(05):114-119.
[8] 胡明揚.現代漢語詞類問題考察[J].中國語文,1995(05):381-389.
[9] 鄒冰羿.現代漢語中的詞類活用及其修辭效果[J].西部素質教育,2017,3(06):273.
[10] 寧致遠.掌握不同詞類的特點,準確地遣詞造句(一)[J].人民司法,1981(03):37-38.
作者簡介:馬逸純(1998—),女,廣東汕頭人,本科在讀,研究方向:電子商務。
馬森濤(1999—),男,廣東汕頭人,本科在讀,研究方向:電子商務。
溫惠妮(2000—),女,廣東揭陽人,本科在讀,研究方向:電子商務。
楊湘穗(1999—),女,廣東茂名人,本科在讀,研究方向:軟件工程。