







摘要:【目的】為改進消費品質量和服務、提升消費者滿意度和品牌競爭力提供依據,助力消費品市場有序健康發展。【方法】以2016—2021年從政府官方平臺獲取的23,736條投訴文本為基礎,應用BERTopic模型進行主題挖掘,識別主要主題及演化趨勢,并借助投訴主題網絡分析缺陷特征之間的關聯性。【結果】消費品投訴主要集中在電子產品的質量缺陷和售后服務不足,消費者對手機電池問題導致的自動關機關注度較高,投訴主題網絡揭示了投訴內容之間的復雜關系,維修、售后等問題在網絡中占據橋梁地位,消費者重視品牌,并對品牌和產品類別的投訴表現出顯著差異。【結論】所構建的主題模型能夠較好地識別投訴的類別、品牌、缺陷特征等,并詳細展示了各投訴內容之間的關聯性。后續將進一步擴大研究樣本范圍,從更廣泛的渠道獲得投訴文本并進行信息挖掘。
關鍵詞:消費品缺陷;BERTopic模型;文本挖掘;投訴主題網絡
DOI編碼:10.3969/j.issn.1674-5698.2025.06.016
0引言
中國提出構建以國內大循環為主體、國內國際雙循環相互促進的新發展格局,進一步加強內需對經濟增長的推動力。2023年1月31日,習近平主持中共中央政治局第二次集體學習并發表重要講話,習近平總書記強調,建立和完善擴大居民消費長效機制,使居民有穩定收入能消費、沒有后顧之憂敢消費、消費環境優獲得感強愿消費。消費品的量質齊增是擴大內需戰略的關鍵[1],在經濟運行中扮演著“市場調節器”與“宏觀經濟運行指示器”的重要角色,保證消費品質量安全對于保障和改善民生有重要作用[2]。國家市場監督管理總局印發的《市場監督管理投訴信息公示暫行規則》[3],要求消費品投訴信息公開化,公示成為常態,不公示才是特例,遵循“誰處理、誰公示”的原則,提升消費市場的透明度,保護消費者知情權。
投訴是消費者對質量缺陷表達不滿的重要途徑[4-5],投訴信息是消費者在使用后對消費品或服務表達不滿的載體[6],包含負面缺陷信息的投訴比正面營銷信息更能獲得潛在購買者的關注。投訴會引起政府介入、誘發企業輿情危機,對企業品牌聲譽造成致命打擊[7]。口碑營銷對品牌帶來的正面效應往往經不起一次負面投訴的沖擊[8-9]。投訴產生的負面口碑通過社交媒體的傳播擴大了影響人群范圍[10],從而更大范圍地削減消費者對品牌的忠誠度[11]。投訴比差評需要消費者投入更多的精力,只有在嚴重質量缺陷并損害權益時,消費者才會進行投訴[12]。不同于第三方平臺或社交媒體上進行情緒宣泄的差評[13],投訴是消費者向政府部門尋求維權的重要信號,表明差評已經無法滿足消費者的訴求。對投訴文本進行挖掘是發現消費品質量缺陷的重要方式,為消費者進行購買決策提供參考,同時幫助企業正視缺陷,降低消費市場信息不對稱程度[14],維護消費者的合法權益。
在此背景下,本文基于國家市場監督管理總局獲得的消費者投訴文本,研究消費品存在的質量缺陷問題。本文數據具有如下優勢:第一,數據的可靠性。數據來自政府部門及其官方平臺,不同于第三方投訴平臺(如黑貓投訴)中包含較多的噪聲信息。第二,數據的相關性。相比前人研究,本研究數據擁有較高的缺陷信息含量和較低的消費者情緒傾向,能夠準確定位品牌及其缺陷情況。
1文獻綜述
1.1消費者投訴研究現狀
投訴作為消費者表達不滿、維護自身權益的重要渠道,其對企業經營、市場表現及消費者保護機制等方面具有重要影響。現有研究圍繞消費者投訴的影響機制、檢測與分析方法、企業應對策略等方面展開,取得了豐富的研究成果。在消費者投訴的影響機制方面,研究發現消費者投訴對企業的銷售、運營及市場表現具有顯著影響。消費者投訴不僅可能直接導致銷量下降,還可能通過影響企業聲譽和品牌形象間接作用于市場表現。在消費者投訴的檢測與分析方法方面,研究者利用自然語言處理(NLP)方法對非結構化投訴文本進行了深入探索,包括基于社交媒體評論的缺陷識別系統[4]、基于圖論的半監督學習方法[15],以及結合句子和單詞級別的注意力機制的投訴識別模型[16],有效提升了消費者投訴的自動化檢測與分析能力。企業采取積極的召回措施有助于降低因缺陷產品投訴引發的市場損失[17],引入基于人工智能的智能客服系統能減少投訴量并提升客服績效[10]。此外,企業對負面投訴的回應方式需慎重選擇,幽默回應可以在一定程度上提升品牌知名度,但也可能損害消費者對品牌的信任[18]。
1.2主題模型研究現狀
主題模型作為一種無監督的機器學習方法,在文本分析中發揮了重要作用,能夠通過構建詞共線矩陣來識別文本中的潛在主題,幫助研究者完成文本分類、信息關聯和整合[19]。當前,學術界廣泛應用的主題模型主要包括LDA和BERTopic模型。LDA模型是經典的主題挖掘方法,通過引入狄利克雷先驗分布對詞語進行向量化并計算其概率,構建主題的詞語分布[20]。該模型已在用戶內容與行為分析中取得較多成果,如Jia[21]利用LDA分析中美顧客評論以揭示文化差異,Kirilenko等[22]利用LDA提取游客負面評論中的不滿主題。
基于Transformer架構的BERTopic模型通過預訓練方式學習文本的語言特征。BERTopic模型先在無標簽的語料庫中進行訓練,然后通過有標簽的數據進行微調[23],利用經過預訓練的句子嵌入模型將文本向量化,以向量聚類方式學習文本中的語言特征[24],從而挖掘潛在主題。Grootendorst[25]提出了BERTopic模型,使用預訓練語言模型生成文檔嵌入,并對嵌入進行聚類,最后基于c-TF-IDF生成主題。Wang等[26]利用BERTopic分析圖書館與信息科學領域的發展趨勢。Sanchez-Franco等[27]應用該模型挖掘消費者評論中的主觀體驗信息。
2研究設計
2.1數據獲取與預處理
本文數據來自國家市場監督管理總局、缺陷產品管理中心、中國政府網等官方網站及公眾號,以及郵件、電話、信訪獲得的投訴文本,時間跨度為2016—2021年,在去掉部分重復投訴信息后共獲取投訴文本23,736條。圖1展示了主題挖掘與分析流程。
借助Python對投訴文本進行數據清洗和預處理,將重復及無意義的投訴文本剔除。使用中文分詞工具jieba對文本進行分詞,借助哈工大停用詞表清洗掉部分無研究價值的符號、語氣詞等。除此之外,對文本先進行數十次訓練,記錄對于主題聚類無意義的詞匯,例如時間信息詞“2016”“上旬”“十月”,網站信息詞“comhttps”,程度信息詞“經常”“不到”“可能”等,加入停用詞表,最大程度降低無意義詞對模型訓練結果的影響。
2.2BERTopic模型
BERTopic模型是1種先進的深度學習算法[25],可以對大批量文本進行計算并提取其中的關鍵信息,挖掘文本背后的隱藏問題,助力決策者制定科學的戰略規劃[28-29]。BERTopic基于BidirectionalEncoderRepresentationsfromTransformers(BERT)語句嵌入模型,利用Transformer和c-TF-IDF創建聚類,對主題進行畫像并保留關鍵含義的詞語。使用BERTopic模型進行主題建模會經歷以下4個階段:詞嵌入(SentenceTransformer)、詞向量降維(UMAP[30])、聚類(HDBSCAN[31])、主題詞獲取(c-TF-IDF)。與LDA、LSA等主題模型相比,BERTopic模型主要有以下優點:1)可以與不同的嵌入模型相結合;2)通過HDBSCAN,BERTopic模型能夠有效處理噪聲文本;3)非常適合處理時間序列數據;4)在結合降維算法(UMAP)和高效聚類算法(HDBSCAN)時,BERTopic模型擅長處理大規模文本數據;5)很好地解決密度聚類與中心采樣之間不兼容的問題[32]。
本文涉及BERTopic模型的具體過程如下:
(1)詞嵌入。使用Sentence-Transformer深度學習模型將分詞得到的詞語進行編碼并計算詞語之間的相似度,通過自注意力機制和位置編碼來生成高維詞向量,選擇支持中文文本嵌入的多語言模型paraphrase-multilingual-MiniLM-L12-v2實現文本嵌入,并保留詞語位于原投訴文本中的語義關聯信息。
(2)詞向量降維。由于獲得的詞向量處于高維空間,很難被聚類算法處理。UMAP算法在降維過程中對于保留詞向量的全局結構方面表現良好,使得降維后的詞向量仍保留原有意義。因此本文借助降維算法UMAP對高維詞向量進行降維并獲得新的低維詞向量。
(3)聚類。使用無監督算法HDBSCAN對降維后的詞向量進行聚類,形成語義相近的文本聚類結果。
(4)主題詞獲取。采用c-TF-IDF算法計算聚類的整體詞頻,提取每個聚類的特征詞,從而識別每個聚類的主題。
2.3社會網絡分析
通過BERTopic模型獲得的主題詞構建投訴主題網絡,借助主題詞之間的共線關系發現投訴的關聯性。將主題詞作為網絡節點,同一條投訴文本中各主題詞之間的共線關系作為網絡的邊,從而形成投訴主題網絡。對投訴主題網絡的分析可以揭示投訴文本中不同主題內容之間的聯系強度、結構特征等,并發現關鍵投訴主題詞在網絡中的中心性等信息。投訴主題網絡將幫助識別消費者重點關注的投訴領域,挖掘出各缺陷之間的聯系,為改進消費品質量提供支持。
3結果分析
利用BERTopic模型對投訴文本進行主題建模,在多次實驗的基礎上調整參數獲得最終模型。為使得每個主題能夠盡可能多地包含更多信息,設置最小主題大小為100,共識別獲得17個主要投訴主題(Topic0~Topic16),涵蓋了消費者投訴信息中的19,676條投訴文本,另外有4060條投訴文本被歸為噪聲主題(Topic-1)。噪聲數據中除了少部分離群投訴文本外,絕大多數都是聚類規模沒有達到100(即該主題所包含的投訴文本lt;100條)的投訴主題。
3.1投訴主題識別
表1展示了識別獲得的17個主要主題的基本情況。從表1中可以看出,噪聲主題Topic-1擁有4060條文本數量,占全部文本的比例超過1/6,這部分投訴文本并沒有被歸入主要主題內進行研究,但不可忽視的是,噪聲主題重點關注了售后問題。主題4所占比例最高,擁有超過6500條投訴文本,占全部投訴量的27.77%,這表明關于手機、售后的問題受到消費者的廣泛關注;主題4、2、12文本數量超過3000,共占全部投訴量的58.89%,主題4和主題2重點關注2款品牌手機問題,品牌X的缺陷集中于主板故障導致的售后問題,而品牌A則存在電池問題而導致自動關機,主題12關注空調等家電的售后維修問題,顯示出消費者對傳統家電行業售后維修的重視;主題0、8、9、10、14、16的投訴文本數量在400~1000,這些主題關注“自動關機”“電量”“電動車”“電腦”“屏幕”等存在的缺陷,說明與電相關的消費品受到關注,這可能與該類型消費品的單位價值高、安全隱患大有關;主題1、3、5、6、7、11、15的文本數量在400以下,主要關注“電池電量”“顯示屏”“充電”等問題。總之,消費者投訴對象集中于以手機和電腦為代表的電子消費品領域,并且重點關注電池電量導致的自動關機問題,而空調等電器設備則更重視消費品售后與維修服務。
3.2投訴大類識別
根據3.1節識別出的主題,得到主要主題的聚類結果。如圖2所示,每個氣泡代表一個主題,氣泡的大小代表主題所包含的投訴文本數量,氣泡間的距離代表主題近似程度。Topic12的氣泡包含了Topic3和Topic10的氣泡,這些主題氣泡在距離上接近,主題含義也較為接近。Topic4的氣泡包含了Topic2的氣泡,這2個氣泡最大,距離也最為接近,主要是關于手機存在的質量缺陷問題。Topic0和Topic14距離接近,且有大部分重合,它們位于左下象限靠近D2軸線的位置,這2個主題都與電腦缺陷相關。Topic16包含Topic15,并與Topic13大部分相交,這一部分主要描述的是電子消費品的屏幕存在的缺陷。而位于左下象限的Topic1、Topic5、Topic6、Topic7、Topic8、Topic9、Topic11集中分布于左下角,氣泡較小并且混雜在一起,這些主題都是與電池電量、充電及自動關機相關的部分。
表2為聚類結果的類別劃分表。依據聚類結果,將17個主題劃分為手機、電池、電腦、屏幕及其他投訴大類。手機投訴大類包括主題2和4,手機是遭投訴最多的消費品,共擁有10,837條投訴文本,達到總投訴量的45.66%,這表明消費者十分重視手機的質量,對手機存在缺陷容忍度較低,傾向于向政府尋求投訴維權。電池投訴大類包括主題1、5、6、7、8、9和11,共包含7個主題,是擁有主題數最多的投訴大類,表明關于電池缺陷導致的問題較為復雜,包括自動關機、閃屏、電池鼓包、電量不足、手機開裂及開關機問題。電池問題不僅涉及手機也涉及對電池依賴度較高的電腦。電腦投訴大類包括主題0和14,涉及其中的1322條投訴文本,占比為5.57%,主要是對電腦屏幕和售后維修的投訴。屏幕投訴大類包括主題13、15和16,共擁有1028條投訴文本,占比為4.33%,針對屏幕的投訴主要來自電視機、顯示器及手環。其他投訴大類包括主題3、10和12,共擁有4165條投訴文本,占比為17.55%,包含了耳機、電動車、空調等消費品,針對耳機的投訴主要為佩戴造成的耳道發炎問題,針對電動車投訴主要為行駛過程中輪胎的質量問題,針對空調的投訴主要為售后維修問題。
手機是消費者最為關切的消費品,投訴量占比超過40%。為此,本研究針對手機品牌信息進行識別,發現10,050條文本中含有手機品牌信息,并對品牌信息進行匿名處理。表3展示了中國市場銷售的主要手機品牌投訴量,其中品牌A收到的投訴最多,超過5000條投訴與之相關,其次是品牌X,超過2000條。考慮到銷量情況對投訴量的影響,本文對2016—2021年間占據銷量排名前9的手機品牌進行了統計,銷量數據包括了該品牌旗下的子品牌。為此,計算投訴率以評價不同品牌手機質量,并對銷售量排名前5品牌的銷售量和投訴率進行了分析。如圖3所示,投訴量與銷量情況并不一致,投訴率最高的為品牌A手機。該品牌手機存在的電池問題被廣泛詬病,并且在中國市場售價普遍偏高,消費者對其質量預期要高于其他品牌,當出現質量缺陷時,更容易遭遇用戶投訴。國產手機品牌V、O、H和X投訴率較低,顯示出國產手機質量受中國消費者的認可。式(1)為投訴率的計算公式,根據2016—2021年間該品牌的總銷售量和總投訴文本數來計算。
3.3投訴主題網絡
為探尋各投訴內容之間的關聯性,在社會網絡視角下,根據BERTopic模型獲得的主題(剔除Topic-1)中包含的主題特征詞,將詞頻數大于100的特征詞作為主題網絡節點,該網絡包含108個節點,663條無向邊。主題特征詞提取、投訴主題網絡構建借助Python,網絡可視化使用Gephi0.10.1。利用投訴主題網絡分析投訴內容之間的關系,特征詞聯系越緊密,即2類缺陷投訴之間的相關性越高[33],特征詞之間無共線關系,表明2類缺陷投訴之間無關聯。
投訴主題網絡如圖4所示,圖4中節點大小代表特征詞數量多少,即度數中心度,連線粗細代表各主題特征詞之間的相關性大小,連線越粗相關性越強。由圖4可知發現2個聚類集群,一個是以“開機”“電量”“電池”等為核心的聚類集群,由電池問題引發的一系列質量缺陷,并且這些缺陷與手機聯系密切。另一個是以“維修”“售后”“屏幕”等節點為核心的聚類集群,由售后問題導致的服務不滿,與售后要求較高的消費品聯系密切,如“電視”“電腦”等。這些節點面積較大,表明它們的度數中心性較高。2個聚類集群都聚焦于電子消費品的缺陷,表明消費者對以手機為代表的電子消費品缺陷容忍度較低,可能與電子消費品單位價格高有關。
消費者對電子消費品的重要零部件也保持重點關注,如電池、充電器、屏幕、硬盤、主板等。零部件的缺陷對消費品整體質量管理十分重要。消費者很多情況下是針對消費品出現缺陷的零部件進行投訴,并不是針對整件消費品進行投訴。例如電池電量不足導致手機自動關機,手環屏幕亮度不夠導致在室外很難看清。在投訴主題網絡的左下部分,關于電動車的聚類集群獨立于主體網絡,說明關于電動車的缺陷投訴與其他消費品的缺陷投訴無關聯。電動車缺陷特征包括“剎車”“輪胎”“行駛里程”等。在投訴主題網絡的右下部分,對手環投訴的問題主要為亮度不高。除此之外,本文發現當電池電量位于50%時,部分消費者就陷入電量焦慮狀態。
3.4網絡結構分析
表4展示了投訴主題網絡的基本結構特征。網絡密度用于衡量整體網絡特征,反映各節點之間聯系的緊密程度,為網絡的連接數與可能連接數之間的比值,值越接近1,表示網絡連結越緊密。該網絡的密度為0.1147,涉及的消費品缺陷特征覆蓋面廣,可以較好地反映消費者投訴關注的缺陷全貌。連接數代表網絡中各節點之間的連線數量,該網絡連接數為663,網絡中各節點之間存在大量連接,各投訴節點之間聯系廣泛。聚類系數用來衡量節點與鄰近節點的緊密程度,值越接近1,節點聯系越緊密。該網絡的聚類系數為0.8831,表明各節點之間的聯系緊密,缺陷特征的集中度較高。同時,該網絡的平均度為12.2778,反映網絡的平均連接數和節點的整體連結情況。除電動車外,各投訴聚類集群之間存在普遍的關聯性。由于該網絡為非連通圖,因此,僅計算最大連通分量下的直徑和平均路徑長度,分別為4和2.3280。
表5展示了主題網絡度中心性排名前20節點的特征。該表展示了節點的度中心性、加權度、接近中心性和中介中心性。度中心性為一個節點的度數與網絡中總節點數(減去1)之間的比值,用來識別網絡中的重要節點。由表5可知,“維修”“售后”“客服”“屏幕”“自動關機”等節點度中心性不低于0.2,是網絡的關鍵節點,表明消費者對售后維修服務存在較大不滿,對“屏幕”“自動關機”關注度較高,是投訴的重點內容。同時,加權度指的是節點與其鄰近節點連接邊的權重之和,同樣用于評估節點的重要性。上述5個節點的加權度也較大,顯示在投訴主題網絡中占據重要位置。網絡中節點的接近中心性指該節點到其他所有節點的平均距離的倒數,反映節點在網絡中的相對地位。節點的接近中心性越高,該節點越核心。投訴主題網絡中,“售后”“維修”“客服”“自動關機”4個節點的接近中心性均超過0.4,在連接其他節點中具有關鍵作用。中介中心性衡量一個節點在網絡中的中介作用,反映節點在網絡中扮演的橋梁作用,只有“售后”“維修”“自動關機”3個節點的中介中心性大于0.1。
從表5中可以發現,“維修”“售后”是消費者反映較多的內容,它們的度中心性、加權度、接近中心性和中介中心性在所有節點中是最高的,表明商家提供的售后維修服務無法滿足消費者的要求。同時“維修”“售后”連接較多種類消費品的投訴內容,在一定程度上反映售后維修問題是困擾消費者的重要共性問題。值得注意的是,圖4中共線頻率較高的“開機”“電量”“屏幕”等節點并沒有出現在表5中,它們的度中心性、加權度、接近中心性及中介中心性值并不高,表明其只是以手機為代表的電子消費品的獨有缺陷,并非被投訴消費品的共性問題。
4結論
消費者投訴是反映消費品缺陷最直觀的證據,品牌信息、缺陷特征、負面情緒都包含在消費者投訴文本中,借助自然語言處理技術能夠剔除消費者情緒化表達的干擾,獲得消費品真實的缺陷信息。本文基于BERTopic模型對來自官方投訴平臺的投訴文本進行主題挖掘與缺陷發現,通過構建投訴主題網絡探究各投訴主題之間的關聯性,得出以下結論:
(1)電子消費品的質量缺陷是投訴的重點對象。手機、電腦、手環、耳機等被消費者重點關注,自動關機、黑屏等問題在消費者投訴中被多次提及,電池、屏幕等零部件質量問題是電子消費品產生缺陷的重要原因。(2)消費品質量缺陷和售后服務不滿高度相關。消費品缺陷問題無法得到售后的及時回應和解決,使得消費者尋求投訴途徑以獲得自身權益保障,消費品缺陷和售后不滿的疊加因素導致了投訴的發生。(3)不同消費品領域的投訴差異明顯。手機的投訴集中于電池不足和自動關機問題,電腦的投訴則集中在電池鼓包、屏幕故障等方面,而電動車投訴則相對獨立,主要關注剎車、輪胎等問題,與其他消費品投訴主題聯系較弱。(4)投訴以品牌為基準。消費者投訴普遍提及品牌信息,直接反映了品牌在質量控制和消費品體驗方面的不足,消費者容易形成對品牌的刻板負面印象。
企業應建立動態投訴監測與分析機制,重視消費者訴求。以往研究表明,企業聲譽和品牌影響力十分重要[34-36],零部件供應鏈管理是消費品質量管理的關鍵,企業要重視售后服務,確保消費品全生命周期內的使用體驗。雖然本文借助自然語言技術對投訴文本進行主題挖掘具有一定的客觀性,但由于投訴文本來自政府平臺,與來自第三方平臺有關的投訴相比,樣本量較小,具有一定的局限性。
參考文獻
馬勝男,王旭華,孫錫敏,等.適應新發展階段的中國消費品標準化戰略轉型研究[J].中國科學院院刊,2022,37(9):1248-1258.
陳明華,史楠,王山,等.邁向消費品統一大市場:基于價格溢出視角的消費品市場一體化水平測度與分析[J].
中國軟科學,2024(11):87-99.
中國政府網.市場監督管理投訴信息公示暫行規則[Z].2023
ABRAHAMSAS,JIAOJ,WANGGA,etal.Vehicledefectdiscoveryfromsocialmedia[J].DecisionSupportSystems,2012,54(1):87-97.
PASCUAL-NEBREDAL,CABANELASP,BLANCO GONZALEZA.CriticalincidentsanddissatisfactioninB2Brelationships:anappraisaltheoryanalysis[J].JournalofBusinessamp;IndustrialMarketing,2023,38(7):1574-1586.
蔡衛星,蒲雨琦,李浩民.顧客至上:消費者在線投訴的基本面預測能力研究[J].管理世界,2024,40(5):139-154.
施文,渠玉杰,蔣國銀.基于隨機Kriging的汽車品牌質量序貫主題比較研究[J].中國管理科學,2023,31(11):114-127.
孫瑾,苗盼.口碑效價因人而異:調節定向與社會距離對消費者口碑效價的影響[J].南開管理評論,2021,24(5):202-214.
黃敏學,王峰,謝亭亭.口碑傳播研究綜述及其在網絡環境下的研究初探[J].管理學報,2010,7(1):138-146.
WANGL,HUANGN,HONGY,etal.Voice-basedAIincallcentercustomerservice:Anaturalfieldexperiment[J].ProductionandOperationsManagement,2023,32(4):1002-1018.
URUENAA,HIDALGOA.Successfulloyaltyine-complaints:FsQCAandstructuralequationmodelinganalyses[J].JournalofBusinessResearch,2016,69(4):1384-1389.
HUN,ZHANGT,GAOB,etal.Whatdohotelcustomerscomplainabout?Textanalysisusingstructuraltopicmodel[J].TourismManagement,2019,72:417-426.
張公讓,鮑超,王曉玉,等.基于評論數據的文本語義挖掘與情感分析[J].情報科學,2021,39(5):53-61.
SCOTTJE,GREGGDG,CHOIJH.Lemoncomplaints:Whenonlineauctionsgosour[J].InformationSystemsFrontiers,2015,17(1):177-191.
SINGHA,SAHAS,HASANUZZAMANM,etal.
Identifyingcomplaintsbasedonsemi-supervisedmincuts[J].ExpertSystemswithApplications,2021,186:115668.
DASS,SINGHA,SAHAS,etal.NegativeRevieworComplaint?ExploringInterpretabilityinFinancialComplaints[J].IEEETransactionsonComputationalSocialSystems,2024,11(3):3606-3615.
SHAOQ,LIYN,WEIJ,etal.Apunishmentsharedisapunishmenthalved:Concurrentrecallsreduceproducts'marketshareloss[J].Psychologyamp;Marketing,2024,41(8):1715-1734.
SARKARS,RAJAGOPALANB.Consumersafetycomplaintsandorganizationallearning:evidencefromtheautomotiveindustry[J].InternationalJournalofQualityamp;ReliabilityManagement,2018,35(10):2094-2118.
曹麗娜,唐錫晉.基于主題模型的BBS話題演化趨勢分析[J].管理科學學報,2014,17(11):109-121.
韓亞楠,劉建偉,羅雄麟.概率主題模型綜述[J].計算機學報,2021,44(6):1095-1139.
JIASS.MotivationandsatisfactionofChineseandUStouristsinrestaurants:Across-culturaltextminingofonlinereviews[J].TourismManagement,2020,78:104071.
KIRILENKOAP,STEPCHENKOVASO,DAIX.
Automatedtopicmodelingoftouristreviews:DoestheAnnaKareninaprincipleapply?[J].TourismManagement,2021,83:104241.
DEVLINJ,CHANGMW,LEEK,etal.BERT:Pre trainingofDeepBidirectionalTransformersforLanguageUnderstanding;proceedingsoftheConferenceoftheNorth-American-ChapteroftheAssociation for-Computational-Linguistics-HumanLanguageTechnologies(NAACL-HLT),Minneapolis,MN,FJun02-07,2019[C].2019.
陸偉,李鵬程,張國標,等.學術文本詞匯功能識別:基于BERT向量化表示的關鍵詞自動分類研究[J].情報學報,2020,39(12):1320-1329.
GROOTENDORSTM.BERTopic:Neuraltopicmodelingwithaclass-basedTF-IDFprocedure[J].arXivpreprintarXiv:220305794,2022.
WANGZ,CHENJ,CHENJ,etal.IdentifyinginterdisciplinarytopicsandtheirevolutionbasedonBERTopic[J].Scientometrics,2023,129(11):7359-7384.
SANCHEZ-FRANCOMJ,REY-MORENOM.Dotravelers'reviewsdependonthedestination?Ananalysisincoastalandurbanpeer-to-peerlodgings[J].Psychologyamp;Marketing,2022,39(2):441-459.
聶亞青,吳庭璋,王若佳,等.基于BERTopic模型的健康信息學主題挖掘與發展演化研究[J].情報科學,2024,42(4):98-110.
徐漢青,滕廣青.機遇與挑戰:基于BERTopic的AI環境下圖書館主題文本挖掘[J].情報科學,2024,42(4):119-128.
MCINNESL,HEALYJ,MELVILLEJ.Umap:Uniformmanifoldapproximationandprojectionfordimensionreduction[J].arXivpreprintarXiv:180203426,2018.
RAHMANMF,LIUW,SUHAIMSB,etal.Hdbscan:Densitybasedclusteringoverlocationbasedservices[J].arXivpreprintarXiv:160203730,2016.
胡凱茜,李欣,王龍騰.基于BERTopic模型的網絡暴力事件衍生輿情探測[J].情報雜志,2024,43(7):146-153.
蘇敬勤,許昕傲,李曉昂.基于共詞分析的我國技術創新政策結構關系研究[J].科技進步與對策,2013,30(9):110-115.
LAIC-S,CHIUC-J,YANGC-F,PAID-C.TheEffectsofCorporateSocialResponsibilityonBrandPerformance:
TheMediatingEffectofIndustrialBrandEquityandCorporateReputation[J].JournalofBusinessEthics,2010,95(3):457-469.
DELLAROCASC.Thedigitizationofwordofmouth:Promiseandchallengesofonlinefeedbackmechanisms[J].ManagementScience,2003,49(10):1407-1424.
VELOUTSOUC.Enlighteningthebrandbuilding audienceresponselink[J].JournalofBrandManagement,2023,30(6):550-566