doi:10.3969/j.issn.1673-0194.2025.15.073
[中圖分類號]G64;F590 [文獻標識碼]A [文章編號]1673-0194(2025)15-0236-05
0 引言
自2007年開始,中國民航運輸總周轉(zhuǎn)量位居世界第二。截至2023年底,獲得通用航空經(jīng)營許可證的傳統(tǒng)通用航空企業(yè)690家,同比凈增29家;2023年全行業(yè)完成旅客運輸量61957.64萬人次,同比增長 146.1% ;旅客周轉(zhuǎn)量10308.98億人公里,同比增長163.4% 。我國民航業(yè)務(wù)規(guī)模已居世界前列,但航空服務(wù)質(zhì)量仍有待提升,在2023年SKYTRAX全球航空獎年度榜單中,國內(nèi)航空公司(以下簡稱航司)皆未進入前五,2023年度民航局消費者事務(wù)中心受理旅客服務(wù)投訴量高達30.27萬件[1]。
旅客投訴是航空服務(wù)質(zhì)量的直接體現(xiàn),通過對投訴數(shù)量、種類、內(nèi)容的研究,能夠識別出航空服務(wù)的短板,尋找提升服務(wù)質(zhì)量的路徑與方法。目前關(guān)于航空旅客投訴的研究大多數(shù)為對基本數(shù)據(jù)的分析,缺乏對投訴文本的深層次剖析。例如,楊省貴等人選取中國民用航空局的機場旅客投訴統(tǒng)計數(shù)據(jù),分析了我國民航機場旅客投訴的數(shù)量和內(nèi)容特征[2;呂文暢以近15年民航機場投訴量、旅客吞吐量等基礎(chǔ)數(shù)據(jù)為研究對象,提出了基于ARMA模型的機場投訴量預(yù)測方法,并據(jù)此對2023年機場投訴量進行了預(yù)測[3]。
因此,本文以黑貓投訴平臺的投訴文本為素材進行量化分析,旨在從消費者角度出發(fā),深入挖掘投訴文本中蘊含的信息,探究旅客投訴原因,并據(jù)此提出改進建議,以期為航司服務(wù)質(zhì)量提升策略的制定提供參考。
1 研究設(shè)計
采用廣泛應(yīng)用于投訴文本話題識別的LDA主題挖掘算法[4-5]對國內(nèi)主要航司的旅客投訴文本進行主題挖掘,確定投訴文本的主題分類,獲取該分類下的主題關(guān)鍵詞,并基于樸素貝葉斯算法的投訴文本自動分類框架研究,具體的研究設(shè)計如圖1所示。
圖1研究設(shè)計框架

2 數(shù)據(jù)獲取與預(yù)處理
以中國民用航空局《月度航空運輸消費者投訴情況的通報》中涉及的41家航司作為國內(nèi)航司的代表。選取國內(nèi)首個公開性在線投訴平臺一一黑貓投訴,該平臺具有投訴門檻低、投訴信息全公開、投訴記錄可回溯等優(yōu)點,其所公布的數(shù)據(jù)已經(jīng)被大批學(xué)者作為素材進行研究[。爬取2024年1月1日至2024年6月30日間黑貓投訴平臺各航司旅客投訴數(shù)據(jù)共計11409條,去除重復(fù)、無意義辱罵或發(fā)泄情緒的數(shù)據(jù)后,共計9394條。
黑貓投訴記錄的旅客投訴信息包含“標題”“狀態(tài)”“時間”“字段”“投訴對象”“投訴要求”六個維度,其中,“標題”為旅客投訴的簡要概述,“字段”為旅客投訴的主要內(nèi)容,是對自身投訴行為及投訴原因的具體解釋,具體示例如表1所示,選取“字段”作為本文分析的主要文本數(shù)據(jù)。
運用Python的jieba分詞模塊將爬取的投訴文本進行分詞、過濾,并通過wordcloud進行詞頻統(tǒng)計,以聚合氣泡圖形式進行可視化,其結(jié)果如圖2所示,其中,氣泡越大詞頻越高,反之亦然。
表1國內(nèi)航司旅客投訴數(shù)據(jù)示例

圖2關(guān)鍵詞氣泡圖

關(guān)鍵詞可視化結(jié)果表明,旅客對機票改簽及退票的手續(xù)費、航班變動的原因及通知、延誤后航司及平臺處理和客服服務(wù)等方面較為重視,尤其體現(xiàn)在退改簽的手續(xù)費及非正常航班處理方面。
3 航司投訴文本的主題挖掘
采用廣泛應(yīng)用于熱點分析[、主題識別、特征提取[1]等領(lǐng)域的LDA模型進行文本主題挖掘,該模型通過無監(jiān)督機器學(xué)習(xí)推導(dǎo)分析出文本數(shù)據(jù)中“文檔/詞一主題”的概率分布,分別揭示其“文檔”和“詞”的主題結(jié)構(gòu),包括主題分布和相互關(guān)系。
困惑度(perplexity)是評價LDA主題模型的指標,困惑度越低說明模型越好,借助python的skleam庫對預(yù)處理過后的投訴文本進行LDA模型訓(xùn)練,設(shè)置模型先驗參數(shù) α=0.1 , β=0.01 。
不同主題數(shù)目下的困惑度變化情況如圖3所示,結(jié)果表明,隨著 k (主題數(shù)目)的增大,困惑度逐漸減小,并且當 k 約等于9時,存在明顯的拐點,故拐點9即為 k 的最佳值[1]。
圖3Perplexity-Topics曲線圖

確定主題數(shù)目后,將主題概率分布最小閾值設(shè)置為0.01,以排除冷門主題;將超參數(shù) a 、均設(shè)置為自動模式,以便從語料庫中學(xué)習(xí)先驗知識;將iterations設(shè)為100次,確保模型在推斷主題分布時能趨于穩(wěn)定狀態(tài)[12]。模型經(jīng)過訓(xùn)練后,得到了9個相關(guān)性較高的主題,主題分布情況如表2所示。
表2國內(nèi)航司旅客投訴LDA主題分布

同一主題下的詞匯分布相關(guān)性較高,說明主題聚類效果較好。旅客投訴最關(guān)注的2個主題分別是T1和T9,其中T9主題“一般退改簽政策”約占總數(shù)的1/5,T1主題“航班變動對行程的影響”約占總數(shù)的1/6;T4主題“在線客服售后服務(wù)問題”和T7主題“票價變動與消費者權(quán)益”占比均超 13% 。
由于所獲得的部分主題的關(guān)鍵詞出現(xiàn)重復(fù)現(xiàn)象,因此根據(jù)LDAvis可視化氣泡圖(圖4)及各個主題的關(guān)鍵詞實際情況,將各主題做合并歸納處理。
圖4LDAvis可視化氣泡圖

圖4中,除Topic5和Topic9有較明顯重疊之外,其他主題無明顯重疊現(xiàn)象,分類效果較好,結(jié)合各個主題的高頻關(guān)鍵詞實際情況發(fā)現(xiàn),Topic5和Topic9中僅“全額”和“航司”兩個關(guān)鍵詞有重疊,其余關(guān)鍵詞無較直觀的相關(guān)性。回溯其原始數(shù)據(jù)發(fā)現(xiàn),Topic 5中“因病”“證明”“記錄”等皆為旅客因身體原因無法按時登機時退改簽減免手續(xù)費的相關(guān)規(guī)定;Topic9中“手續(xù)費”“高額”“不影響二次銷售”等亦可明顯看出是有關(guān)退改簽手續(xù)費收費標準,且與Topic6中的“全額”“手續(xù)費”“規(guī)定”等有諸多重疊之處,但Topic6則更側(cè)重于“錯購”的情形,如此,三者均為退改簽的手續(xù)費問題及相關(guān)規(guī)定,遂將其合并為“退改簽規(guī)則”主題;Topic1中的“航班取消”“航班延誤”“計劃”“影響行程”等是有關(guān)航班變動對旅客后續(xù)行程(“高鐵”“第二程”等)所造成的影響(“損失”“問題”),將其歸納為“航班變動對行程的影響”主題;以此類推,最終將所得的9個主題整理歸納為“航班變動對行程的影響”“民航購票費用與規(guī)定”“民航票務(wù)服務(wù)問題”“在線客服售后服務(wù)問題”“退改簽規(guī)則”“票價變動與消費者權(quán)益”以及“行李運輸收費規(guī)則”7個主題,其具體內(nèi)容和文本分布情況如表3所示。
表3國內(nèi)航司旅客投訴主題分類及其分布

“退改簽規(guī)則”占比最高,其主題下文檔數(shù)占據(jù)總文檔數(shù)的 34.09% ;其次是“航班變動對行程的影響”;“票價變動與消費者權(quán)益”和“在線客服售后服務(wù)問題”兩個主題的文檔數(shù)也相對較高,所占比例分別是 13.01% 和 13.78% ;“民航票務(wù)服務(wù)問題”和“行李運輸收費規(guī)劃”兩個主題的文檔數(shù)則相對較少,分別占據(jù) 9.32% 和 7.44% ;投訴文檔數(shù)占比最少的主題是“民航購票費用與規(guī)定”,為 5.99% 。
結(jié)合各主題內(nèi)容和投訴文本回溯發(fā)現(xiàn)目前航司航空服務(wù)存在的不足主要集中在以下幾個方面。
(1)異常航班處理仍存在模糊地帶。由于航班變動造成的影響復(fù)雜,現(xiàn)有異常航班處理方案及補償范圍無法完全應(yīng)對旅客的實際損失。例如,聯(lián)程航班中由第一程航班延誤導(dǎo)致旅客第二程無法按時登機且沒有合適的航班改簽時,退票仍需支付第二程的退票手續(xù)費。
(2)退改手續(xù)費過高。各航司退改手續(xù)費的制定具有較高的自主權(quán),這種“高度自治”的情況使國內(nèi)部分航司的退改手續(xù)費居高不下,如在起飛前27天退票需支付將近 50% 的手續(xù)費。在高鐵、自駕等替代出行方式不斷增多的情況下,高額退改手續(xù)費可能成為航司客戶流失的重要因素。
(3)特殊退改實施缺乏細則。目前航空公司關(guān)于“因病退改”“錯購”等特殊退改行為的實施缺乏細則,容易引發(fā)航旅糾紛,如因病退改材料對文件形式、語言表述、醫(yī)院級別等要求標注不清,造成多次返工甚至證明材料無法通過審核。
(4)自理行李箱規(guī)制標注不清、提示性不足。民航局規(guī)定的自理行李體積每件不超過 20cm× 40cm×55cm ,所以普遍認知上可上機的為20寸行季箱( 20cm×40cm×55cm ),部分航司規(guī)定只允許16寸/14寸/20寸( 20cm×30cm×40cm) 的行李箱登機,自理行李特殊規(guī)格標準標識不夠明顯,使旅客產(chǎn)生計劃外的托運費用。
(5)售后客服質(zhì)量有待提升。在售后服務(wù)過程中,航司存在電話長時間無人應(yīng)答、服務(wù)態(tài)度欠佳、客戶排隊等候時間過長以及客戶問題未能得到有效解決的狀況,從而對旅客的體驗造成較大的影響。
4航司服務(wù)質(zhì)量提升建議
針對航司航空服務(wù)存在的不足,結(jié)合國內(nèi)部分航空公司先進改革舉措,提出航司服務(wù)質(zhì)量提升建議如下。
(1)完善不正常航班處理。航司應(yīng)及時告知旅客航班狀態(tài),并詳盡解釋其航班變動原因,同時還應(yīng)擴大補償范圍,將更多的情形納入補償范圍。目前南航、川航等已將機型變動、航班變動導(dǎo)致航程改變、航班經(jīng)停點延誤等因素納入客票免費退改適用范圍[13-14],其先進的做法為其他航司不正常航班處理提供了參考。
(2)制定合理的退改簽收費標準。航司應(yīng)根據(jù)票價水平、客艙艙型、時間節(jié)點、客戶屬性等,制定合理的機票退改簽收費“階梯費率”,既能維持旅客忠誠度,又能保障航司的盈利水平,從而在旅客保留與利潤增長之間獲得平衡。
(3)完善特殊退改機制。航司可設(shè)置“容錯”機制,避免因錯購產(chǎn)生的費用,如購票10分鐘內(nèi)退票/改簽免除手續(xù)費,避免因錯購時間、地點、往返等原因造成的高額手續(xù)費。航司還應(yīng)簡化病退證明材料,擴大認可醫(yī)院范圍,南航已將認可的醫(yī)療機構(gòu)范圍擴至衛(wèi)生健康委列明的醫(yī)院及下屬醫(yī)療機構(gòu)[13],這一舉措為各航司特殊退改機制的實施提供了參考。
(4)加強特殊標準標識的鮮明性。在航班標準與普遍認知不一致時,應(yīng)更加突出注明該航班的特殊標準,避免因認知不一產(chǎn)生的糾紛,如在購票時突出顯示自理行李規(guī)格、退改簽標準等注意事項,設(shè)置合理的閱讀時長,閱讀后方可接轉(zhuǎn)購票付款界面。
(5)提升航司售后客服水平。航司應(yīng)通過客服人員的教育與培訓(xùn),不斷提高其知識能力和服務(wù)態(tài)度,使顧客獲得更好的體驗。航司還應(yīng)加強客服自動化和智能化建設(shè),提升客服響應(yīng)速度和準確性。
主要參考文獻
[1]中國民用航空局.2023年民航行業(yè)發(fā)展統(tǒng)計公報[EB/OL].(2024-05-31) [2024-12-25]. https://www.caac.gov.cn/XXGK/XXGK/TJSJ/202405/t20240531_224333.html.
[2]楊省貴,楊蒙蒙,徐昶.我國民航機場旅客投訴分析及服務(wù)提升[J].重慶交通大學(xué)學(xué)報(社會科學(xué)版),2022,22(5):38-47.
[3]呂文暢.基于ARMA模型的民航機場投訴量預(yù)測[J].信息技術(shù)與信息化,2023(5):39-42.
[4]許睿,龍丹,劉佳,等.基于LDA 模型的電力投訴文本熱點話題識別[J].云南大學(xué)學(xué)報(自然科學(xué)版),2020,42(增刊2):26-31.
[5]方小飛,黃孝喜,王榮波,等.基于LDA模型的移動投訴文本熱點話題識別[J].數(shù)據(jù)分析與知識發(fā)現(xiàn),2017,1(2):19-27.
[6]毛澤強.金融機構(gòu)海量投訴數(shù)據(jù)分析與應(yīng)用:基于LDA-TPA模型文本挖掘[J].金融發(fā)展評論,2021(9):81-95.
[7]蔡衛(wèi)星,蒲雨琦,李浩民.顧客至上:消費者在線投訴的基本面預(yù)測能力研究[J].管理世界,2024,40(5):139-154.
[8]殷彩明,袁永旭,王漣,等.國內(nèi)社區(qū)養(yǎng)老服務(wù)熱點分析:基于LDA模型與生命周期理論[J].醫(yī)學(xué)信息學(xué)雜志,2024,45(10): 47-52, 97.
[9]任越,李泊泳,譚科銘.基于“主題—工具一效力\"三維框架的我國傳統(tǒng)村落保護政策研究[J/OL].情報科學(xué),1-31[2024-10-24].
[10]范柏乃,盛中華.數(shù)字經(jīng)濟安全的維度識別、特征提取及分層模型:基于LDA主題分析與扎根理論編碼的混合研究[J].浙江大學(xué)學(xué)報(人文社會科學(xué)版),2024,54(2):5-29.
[11]王浩,方俊濤.基于LDA模型對國家海洋博物館游客在線評論的主題分析[J].科技和產(chǎn)業(yè),2024,24(12):224-230.
[12]葉艷,吳鵬,周知,等.基于LDA-BiLSTM模型的在線醫(yī)療服務(wù)質(zhì)量識別研究[J].情報理論與實踐,2022,45(8):178-183,168.
[13]中國南方航空.關(guān)于調(diào)整南航客票退改規(guī)則的公告[EB/OL].(2023-12-27)[2025-01-13]. https://www.csair.com/cn/about/news/notice/2023/1hil5f18mi7m6.shtml.