商容軒 張 斌 米加寧
(1.哈爾濱工業大學經濟與管理學院 黑龍江哈爾濱 150001)
(2.湖南農業大學公共管理與法學學院 湖南長沙 410000)
隨著第四次工業革命進程的深化,移動智能技術與地方政府治理正進行深度融合。在新冠肺炎疫情爆發后,“非接觸”的疫情防控原則推動政府公共服務供給模式加速走向“缺場”。隨著移動互聯網應用滲透率的提升,截至2020年12月,中國在線政務服務用戶規模已達8.43億[1],在線政務服務供給模式也逐漸從“網上辦”轉向“指尖辦”。移動政務APP以其移動性、伴隨性、滲透性、公開性等優勢迅速成為各地方政府深化政務公開、提升地方數字治理水平的重要載體。
當前,在中央“放管服”改革與移動智能技術的雙重驅動作用下,我國移動政務APP普遍開通了在線評論功能,公眾作為地方政府移動政務產品的用戶可以通過對政務APP評級或留言的方式對應用質量進行評價與意見反饋[2]。政務APP在線評論數據每天以指數級趨勢增長,形成了潛在的口碑傳播效應[3],同時由于移動政務產品的特殊性,移動政務產品在線評論的情感傾向性會對用戶線上政務滿意度與政府公信力產生重要影響。當前,隨著各地方政府政務APP的上線與普及,下載量、用戶量、線上業務辦理量等相關客觀數據逐漸成為考核各地線上政務能力的重要指標。部分地區基于上級壓力下的基層數字治理出現“唯數字”的傾向,其政務APP的功能也隨之產生了異化,“線上”比“線下”更麻煩的報道層出不窮,本應是便民利民的移動應用卻反向成為了約束公眾的“異己力量”,有部分學者稱政務APP的普及成為“指尖上的形式主義的泛化”[4]。因此,對移動政務用戶進行細粒度情感分析以提升群眾滿意度、認可度尤為重要。如何利用移動政務用戶的情感分析結果實現公眾需求的精準性滿足,幫助地方政府把握移動政務發展的痛點并提升政府移動公共服務的供給質量與效率,不僅是學術界需要深入探究的熱點問題,也是地方政府作為公共服務供給主體亟須解決的現實問題。
情感分析(Sentiment Analysis,SA)是通過對于評論、問題、事件、案例、新聞等文本信息的研究而挖掘出隱藏在文本中的情緒、觀點的一種研究方法[5]。ABSA是情感分析中的屬性級情感分析任務,該方法由兩大任務構成——方面抽取與情感分析。ABSA的目標是通過提取不同評論實體以及不同屬性方面的情感意見,得到方面級別的<方面,情感>的二元組[6],以確定意見的極性、結果的匯總以及多維度的對比(具體實現過程見圖1)。

圖1 基于方面級評論文本情感分析(ABSA)框架圖
ABSA方法相較于傳統的情感分析任務具有一定的優勢,近年來已經成為自然語言處理領域研究的熱點之一[7]。總體來看,ABSA方法有以下顯著特征:
首先,ABSA方法包含方面抽取與情感極性分析兩大任務目標[8]。在方面抽取任務中,既要完成對評論實體的抽取(Aspect Term Extraction,ATE),又要完成對于方面類別的抽取(Aspect Category Extraction,ACE)。評論實體(Aspect Term,AT)是評論文本中的顯示詞匯,是文本中的固有實體;而方面類別(Aspect Category,AC)經過預定義的評論描述角度,可以是文本中的實體詞匯,也可以是文本中待挖掘的隱式主題。
其次,ABSA方法可以實現細粒度的情感分析任務。在SA中,根據細粒度的不同,可分為三個級別[9]:一是文檔級的情感分析,用于分析整篇文檔的情感傾向。但往往一篇評論型文檔的情感態度并不是單一的,該方法對于進行辯證分析的文本內容是沒辦法進行細致挖掘的;二是語句級的情感分析,用于分析評論數據可以判斷以語句為單位的情感走向,是目前大多數文本分析研究中運用的方法。但此方法存在著認為一條語句僅存在著一種情感的假設前提,但在現實情況中一條評論語句可能是對多方面問題的評述,甚至對不同方面會存在完全不同的轉折情感態度。同時,由于詞袋中相同情感詞匯在不同領域所表達的情感極性也存在截然不同的可能性,因此在應用于跨領域的遷移學習時,其分析結果的準確性十分有限;三是方面級的情感分析即ABSA,該方法通過其兩階段的任務目標,實現了對文本數據的細粒度挖掘,彌補了粗粒度文本分析的局限。
在移動政務問題背景下,移動政務用戶作為政務APP的實際體驗者和功能的使用者,使用過程中會對移動政務系統或服務產生具有差異傾向性的情感。通過對政務APP的用戶評論與反饋進行情感分析與方面級情感匹配,可以探究我國政務用戶對于政務APP基于方面級的屬性需求與情感滿足情況。考慮到移動政務的用戶評論均為較短的文本數據,并且每條評論數據往往包含對政務APP多方面的評價,因此綜合考量ABSA會是一個較為適合的分析方法。它一方面能夠通過主題模型進行方面抽取,實現細粒度的情感差異分析;另一方面也能通過多角度的情感強度測量,得到可驗證的普遍性結論,進而關照本文的研究旨趣。另外,該方法已在商品評價、酒店評論、購物類APP等研究領域中得到使用和驗證,因此方法選擇上具備較成熟的適用性。
目前對于移動政務的研究主要基于以下幾種視角:(1)技術采納視角認為用戶對于移動政務的采納在本質上屬于信息系統采納行為,基于此理論研究者提出了技術接受模型(TAM)[10]、技術接受與利用整合理論(UTAUT)[11]與創新擴散理論(IDT)[12];(2)用戶需要視角認為,移動政務的使用應旨在滿足用戶需求[13],要想完善移動政務服務機制,就要強調公眾需求的重要性,將公眾需求與移動政務建設有機地聯系在一起[14];(3)公眾信任視角認為信任因素是影響公眾的移動政務使用意愿的重要因素[15],從類別上可以細分為政府信任與技術信任[16],從時間上可以細分為初始信任與持續信任[17];(4)用戶滿意視角將提升用戶滿意度作為信息系統成功的目標,D&M模型認為系統質量、信息質量與服務質量共同影響著用戶的滿意程度[18-19],使用行為的滿意度又會影響用戶后續的媒介接觸行為[20-22];(5)用戶持續使用視角基于綜合理論模型,對用戶對政務系統的持續使用與不持續使用行為進行了多角度的實證研究[23-25]。總體而言,現有研究已從多主體的角度,通過實證研究或者案例研究的方式,探究了多種因素在移動政務用戶使用滿意度方面的影響,并據此對政府改進移動政務工作提出優化建議。“如何提升移動政務服務質量和水平”已然成為學者關注的焦點與研究落腳點。
隨著移動政務研究方法的多元化,對用戶評論數據進行情感分析的研究方法,因其對用戶評論情感趨勢的獨特甄別與對用戶痛點的精準挖掘,也逐漸受到電子政務研究學者的青睞。馮小東等通過文本挖掘的方式發現公眾對于政務信息的情感傾向程度會顯著影響政務信息的傳播效果[26]。劉桂琴采用LDA主題模型對政府數據開放網站數據進行訓練,并對不同主題類型的評論情感差異進行探討[27]。劉曉娟和王晨琳將政務微博評論數據作為研究對象,基于SnowNLP模型計算社會情緒以求分析輿情演化趨勢[28]。紀雪梅等構建情感詞典對政務微博公眾評論情感進行計算并進行多因素方差分析,以探究政務回應對公眾情緒的影響機制[29]。但目前運用情感分析方法深度挖掘多用于商品評論,而將其運用于移動政務評論領域的文章數量整體較少。同時,在情感分析方法的選擇中,運用傳統情感分類方法如情感詞典的文章較多,但傳統情感分類方法主要依賴于情感詞典的構建和判斷規則質量,而兩者都需要耗費很多人力(包括人工設計和先驗知識),規則的質量實質上就決定了情感分類質量。因此,結合以上背景與文獻梳理,本文嘗試探究的問題為:運用方面級情感分析方法對移動政務用戶評論進行細粒度的情感挖掘,實現移動政務用戶的情感傾向性測度與分析。
本文構建的基于ABSA方法的移動政務用戶情感傾向性評估基本流程具體步驟包括:(1)獲取用戶在線評論文本,并對評論文本進行預處理,其中預處理包括設置停用詞、設定關鍵詞、分詞、詞性標注、轉詞向量等標準化工作;(2)將進行預處理后的評論文本輸入LDA主題模型,以實現關鍵評論實體的抽取與方面類別的抽取任務;(3)將評論文本直接輸入BERT模型完成ABSA方法中情感傾向性判定的任務;(4)測量評論實體級別的情感距離,進而根據評論實體所屬方面的中心相關度計算方面級情感傾向性;(5)結合移動政務用戶期待模型中劃分的方面層級,根據次級方面的情感傾向性強度測量一級方面的情感傾向指數,從而實現對地方政府政務APP的多維細粒度評估測量。
本文以APPStore上的政務APP為研究對象,篩選出截至2021年5月23日在APPStore上線期間評論量超過1000條的18個便民服務類政務APP,具體包括:浙里辦、江蘇政務服務、天府通辦、皖事通、云上貴州多彩寶、閩政通、遼事通、隨申辦、北京通、i深圳、鄭好辦、智慧南京、智慧青島、e福州、鄂匯辦、辦事通—一部手機辦事通、我的寧夏、椰城市民云。其中以省級政務APP為主,為滿足深度學習模型訓練需求,爬取部分市級APP評論數據進行訓練集的補充,共采集數據42125條評論信息,并采集各APP的用戶在線評論進行量化分析(數據采集格式示例見表1)。

表1 評論數據采集格式示例
數據采集后對評論數據進行預處理工作,合并評論標題與評論內容,將其作為主要的文本研究數據。通過設置停用詞、進行去重等方式,過濾掉無效評論,對評論文本進行標準化清洗處理,清洗后的文本數據作為待使用數據,共35744條評論信息。在數據清洗完成后,對采集的APP用戶在線評論語料進行jieba分詞操作,對特征提取的輸入語料進行初始化操作,以完成對輸入數據的預處理工作。
方面級情感分析可以拆解為兩項任務目標:子任務一的目標是實現方面提取,而子任務二的目標是實現情感分析。本文選取兩項子任務互相獨立的方式進行實驗,其中兩項子任務可同時進行,互不干擾。最終<方面,情感>二元組由子任務目標的規則匹配進行生成。
本文運用LDA主題模型完成方面級情感分析子任務一——方面提取。LDA模型結構包括三層:文檔、主題和詞語,可以進行文本降維及主題聚類[30]。通過LDA主題模型的訓練可以獲得“主題—詞”概率分布為p(wi|k|zk),wi|k是通過LDA主題模型抽取出的評論實體,代表了第k個主題下的第i個詞。評論文本語料經過分詞處理后的其集合為D,LDA主題模型抽取出的評論實體所組成的集合為W,存在集合W∪D,對于元素中的集合存在wi|k∈D。p(wi|k|zk)在本質上是LDA模型所抽取的評論實體與其所屬方面主題的中心相關度。
本文選擇運用BERT模型完成方面級情感分析子任務二——情感分析。BERT是Google在2018年公開推出的一個基于深度雙向編碼器預訓練的語言理解模型,已在評論實體識別、文本分類等多個NLP任務實驗中取得比以前方法模型更高的精度[31]。情感分析任務的目的是給定評論實體,根據文本特征以及上下文內容,按照分類目的給評論實體加上情感傾向標簽并且得到具體評論實體的情感分布概率(積極、中性、消極)以實現傾向性情感判定。本文將數據采集中的移動政務評分直接作為BERT輸入所需的情感分類標簽,其中1、5分別定義為消極與積極情感,其余評分定義為中性情感。嘗試運用BERT、LSTM、CNN、SVM以及KNN完成評論文本情感分類任務,并對比了多模型的精確度、召回率與F1值,實驗中訓練集、驗證集、測試集的劃分比例為6:2:2(多模型文本分類結果見表2)。

表2 多模型實驗參數對比
由表2可以看出,BERT網絡對移動政務評論文本識別F1值達到0.92以上,并且運用BERT模型實現ABSA中的情感分類任務是有效的能夠獲得較高的精確度與召回率。
通過BERT模型所訓練出的評論實體級別積極文本分布概率為p(pos|wi),代表了全部評論文本中第i個評論實體的積極情感傾向指數;消極文本分布概率為p(neg|wi),代表了全部評論文本中第i個評論實體的消極情感傾向指數。θ為標準化系數,通過對于同一主題方面類別的評論實體與主題的情感級別求加權平均值,可以分別得到該主題方面級別的積極情感指數(Aspectpos|zk)與消極情感指數(Aspectneg|zk),分別在式(1)與式(2)中定義:
本文借鑒了Kohavi和Wolpert提出的K-W差異模型[32],通過分析方面級別積極與消極情感的情感距離[33]可以得到評論文本方面級情感傾向指數(Aspect-levelzk),在式(3)中定義:
需要注意的是,本文對于方面屬性定義了兩個級別,分別是:一級方面和次級方面。因此,在本文的方面級情感傾向指數測算中,當topic作為一級方面時,k∈[1,4];而當topic作為次級方面時,k∈[1,10]。當方面級的情感傾向指數小于0時,證明該方面屬性的用戶消極情感相對較為強烈,公眾期待的滿足程度較低;反之,證明該方面屬性的用戶積極情感相對較為強烈,公眾期待的滿足程度較高。同時,經過多方面級別間的橫向對比,可以發現公眾期待的滿足程度較低的方面級因素,從而挖掘出當前移動政務工作的用戶痛點。
通過LDA主題模型的訓練,可以得到形式為<方面,評論實體>的二元組合,通過LDA主題模型的評論文本進行挖掘,得出結果(見表3),方面類別按照“文章—主題”相關度降序排列。用戶對于移動政務的期待與需求主要圍繞使用自愿性、系統穩定性、服務響應性、功能協同性、系統適配性、內容趣味性、內容豐富性、界面交互性、系統流暢性、功能實用性這十個主題方面類別展開。

表3 LDA主題模型評論文本挖掘結果
本文結合期望確認理論與信息系統成功模型,對LDA模型實現的評論詞聚類進行評論目標識別與特征歸類,認為使用動機、服務質量、系統質量與信息質量是當前中國公眾對于移動政務的主要期待維度,并依此構建移動政務用戶需求模型(見圖2)。

圖2 移動政務用戶需求模型
整體來看,移動政務用戶需求模型為雙層模型,本文將LDA主題模型訓練得到的主題方面屬性設定為次級方面,而將根據理論總結與主題歸類的四個維度屬性(使用動機、服務質量、系統質量、信息質量)設定為一級方面。
具體來看,公眾對于使用動機的期待包括內在因素與外在因素,內在動機主要指使用目標的實現,而外在動機主要體現為社會接納。對于公眾而言,如“健康碼”等業務的普及成為公眾出行生活的常態化需求。從政府的角度來看,移動政務應用的下載量與使用量成為了衡量地區移動政務發展水平和網絡可見度[34]的重要指標,于是有部分地區強迫基層公職單位與所屬事業單位部門人員進行下載與推廣。而在LDA主題模型的文本挖掘的結果中,使用自愿性這一主題的文檔相關度最高,因此可以發現中國公眾對于使用自愿性的期待是十分強烈的。
公眾對于服務質量的期待主要體現為服務響應性與服務可靠性,當前中國公眾對于移動政務的可靠性期待基于對政府的信任,但當科技公司成為移動政務發展的重要中介時,對技術以及科技公司的信任也會逐漸影響公眾對于可靠性期待的滿足。公眾對于服務響應性的期待既包括對于用戶個性化需求反饋的期待,又包括部分便民業務辦理的即時性需求即對于響應速度的期待。
中國公眾對于移動政務系統質量這一維度的期待屬性相對豐富,具體包括穩定性期待、流暢性期待、適配性期待以及易用性期待。系統的穩定性與流暢性可以提供給用戶愉悅的使用感受,產生心流體驗從而提升用戶的持續使用能力。系統的適配性期待主要指向系統的運行與維護狀況,由于移動終端設備的多樣,統一的界面與程序就不可能滿足公眾的多樣化需求。系統的易用性期待旨在提升用戶完成目標任務的能力以及使用實際產品的能力。從本質上是提升公眾使用移動政務應用的能力,超過他們使用相應非數字化產品的能力,以弱化實體政務大廳的可替代性,展現具有泛在化特征的移動政務優勢。
中國公眾在信息質量這一層面上,期待咨詢獲取信息內容的豐富性、完整性與趣味性。同時,中國公眾強調共享性體驗即信息功能的協同性需求,公眾期待在政務應用內部或同一地區多政務應用間的個人數據是聯通的,不需要用戶進行反復地填寫與驗證。公眾期待存在于數字空間的移動政務可以完全脫離物理空間的現實世界而存在,避免多次現實的交互,以增強政務應用使用的沉浸感與持續性。最后,與一般性的移動應用相似,公眾對信息質量也同樣存在著功能效用性的期待,移動政務應用使用行為的產生與持續需要有效觸發的連續呈現,并且用戶的動機和能力要高于臨界值才能激活觸發并做出行為。為了在移動政務應用設計中有效地利用觸發,需要優化界面設計、精簡流程,在操作流程中適當的情境和位置為繼續行動提供行為號召。
本文對于評論文本數據通過BERT情感分析模型進行情感3分類,測算出通過LDA抽取出的關鍵實體的積極情感分布概率與消極情感分布概率。并結合主題-詞匯相關度為情感分布概率賦值,測度出不同次級方面的Aspect-level。通過對于主題情感強度正負的判斷與情感傾向性指數可以了解當前移動政務在不同方面級別的情感滿足程度(其情感滿足程度見表4)。

表4 政務APP方面級情感傾向強度指數表
根據政務APP方面級情感傾向強度指數表可以發現,在使用動機、服務質量、系統質量、信息質量四個公眾關注的方面之中,僅有服務質量的Aspectlevel為正值,可見當前中國公眾對移動政務發展在服務質量方面的需要被滿足程度較高。同時,在一級方面層次進行橫向對比,可以發現中國公眾對移動政務服務質量總體上情感滿足程度相對較高,究其原因,一是電子證照的推廣重塑了行政審批的流程與形態;二是“放管服”改革縮減了審批環節、壓縮了審批時間,縮減了公眾辦理業務的時間成本;三是對于用戶評論的問題以及建議反饋的及時性,匯聚民智,吸納民意有助于改善移動政務服務質量。
系統質量和信息質量兩個一級方面的消極情感傾向較為強烈,情感滿足程度較低。在信息質量方面,功能協同性和內容的豐富性是公眾產生消極情緒的主要因素。從具體的功能以及業務上看,登錄功能、身份認證功能、健康碼功能是從評論文本中挖掘到的公眾使用熱點功能,但以上幾項功能卻在推廣過程中普遍的存在問題。究其原因:一是數據孤島的存在,數據共享問題仍廣泛的影響著民眾的使用感受;二是功能的流程設計仍然較為機械化,重復填寫數據與表單的問題仍然存在;三是功能與服務器的聯動性需要加強,許多公眾在評論中反饋到“無法接收驗證碼”的問題,短信驗證碼的延遲原因可能包括網絡延遲或服務器的通信延遲,要求政府部門在移動政務的建設中既要在技術層面關注服務器的運營與維護,又要在功能設計中注意流程與通訊技術的適配環節。
在公眾較為關注的四個一級方面之中,系統質量的Aspect-level最低,消極情感傾向強度最為強烈。但細化來看,該方面整體的消極情緒主要受系統流暢性的影響,其他三因素:系統穩定性、系統適配性與界面易用性情感影響較小,甚至其中系統適配性會產生正向情緒影響。在現有關于移動政務發展的研究中,尤其是結合信息系統領域的研究,學者多數在對策建議方面指出需要提升系統的整體質量。從本研究結果來看,雖然系統質量的確是移動政務亟需改進的方面,但其成為移動政務發展的痛點的主觀原因是源于公眾在使用過程中的使用感受不佳:出現“閃退”“卡頓”“延遲”“加載”的現象,系統的流暢性不足嚴重削弱了公眾使用政務APP的滿足感,加劇了用戶的負面情緒。
對次級方面的情感傾向強度進行橫向對比(見圖3)。首先,公眾對于政務APP的系統流暢性整體期待較高,但需求滿足程度卻呈現較低的狀態,消極情緒在多個主題方面中最為強烈。且在系統流暢性方面,70%評論實體的消極情感傾向超過50%,政府相關的技術部門與所委托的科技公司的工作質量在用戶登錄、信息加載、程序運行、網絡流暢度等實體層次均亟需進行提升;其次,功能的協同性也是當前中國移動政務發展的痛點,尤其是公眾高頻業務的使用與系統承載力的協調問題;最后,在使用自愿性方面,許多學者都研究了持續使用政務APP的影響因素,但實際上個體的使用意愿在對政務APP的使用感受是存在顯著影響的。在APP的下載與使用動機方面,使用者開始使用移動政務本應基于便利的實用性需求,但實際上政務APP被動使用的情況是廣泛存在的。部分地區政務APP的評論中可以發現,“攤派下載”的情況十分嚴重,從LDA主題模型訓練出的“主題-詞”分布可以看到,在使用自愿性主體方面中,“強制”“下載”“任務”都是被訓練得到的關鍵評論實體,同時“政府”“學校”“醫院”這些體制內及其下屬單位都是承擔攤派下載任務的重要人群,從側面印證了當前公眾在移動政務發展中很關注使用行為的自愿性,強制性的使用要求會增加公眾的消極與厭煩情緒,不利于政府移動政務相關工作滿意度的提升。

圖3 次級方面的情感傾向橫向對比
本文利用以上方法計算在線評論的情感強度,將評論集的四維屬性即使用動機、服務質量、系統質量以及信息質量作為政務APP在線評論的四維度屬性值計算方面級情感強度值,并通過該計算結果對各省級地方政府政務APP進行排序(部分省級政務APP用戶口碑情感測量結果見表5)。

表5 政務APP用戶口碑情感測量結果
根據等級劃分規則和實驗測量數據,正面口碑效用排序結果從大到小依次為:浙里辦、云上貴州多彩寶、江蘇政務服務、天府通辦、鄂匯辦、皖事通、辦事通、閩政通、遼事通。用戶情感口碑計算結果較高的政務APP是浙里辦、云上貴州多彩寶、江蘇政務服務和天府通辦等,用戶對于這些政務APP的評論在整體評論中呈現積極正面的情感態度。用戶情感口碑等級稍低的政務APP是辦事通、閩政通和遼事通。
由于政務APP的特殊性導致用戶無法自由選擇替代性產品,導致用戶使用動機的被動性較高,加劇了用戶使用政務APP的負面情感傾向。自主選擇能力與人的自由需求息息相關,具有內在主動性而進行下載使用的用戶因其自由需求得到相對的滿足,因此更易對該軟件產生積極的情感傾向;反之,在個體被委派以“任務”的形式進行強制性的政務APP的下載與推廣時,就會引發個體抵抗與厭煩的消極情緒。因此,從研究結果來看,當前中國公眾在對政務APP的使用自愿性上情感滿足是缺失的,為提升公眾的情感滿足程度,政府要實現體制內的“凈化”,摒棄“唯數字”的傾向,改進移動政務的宣傳方式,通過不斷拓寬宣傳渠道讓公眾了解并自愿下載使用政務APP。
同時,通過對在線評論的挖掘可以發現,系統質量是影響政務服務APP公眾滿意度的最主要因素,雖然在系統質量這一維度中,系統穩定性、系統適配性、界面友好性與系統流暢性都是公眾對移動政務建設較為關注的方面維度。但從其實際的情感影響來看,系統流暢性是公眾對系統質量所做出的情感反饋具有強度最高的情感影響。系統的流暢性直接影響著政務APP的可用程度,進而影響著政務APP的口碑評價與普及。政府在開發政務APP的過程中,除了要在系統正式上線前要反復測試,確保系統流暢、可用,同時也要在系統正式上線后持續保持關注,實現技術部門或技術公司的定期系統維護工作,避免與手機系統版本不適配的問題發生,對發現的系統問題及時進行版本的更新。
政務APP作為以政府為發布主體的移動應用仍應遵循APP的基本設計邏輯。中國政府相對于企業而言,在收集公眾數據方面具有更強的天然優勢。那么政府如何更好地去管理數據池,如何在部門間實現數據共享的同時去實現有效的數據治理就成為了“數字空間”政府發展的關鍵。從本文情感分析的研究結果來看,當前中國公眾雖然對于移動政務信息供給的創新性、趣味性、豐富性的情感反饋偏向中性態度,可見信息推送與供給的質量并不是當前中國移動政務發展的重點。但從本文需求分析的研究結果來看,中國公眾對移動政務信息推送的精準度、更新的及時性、內容的趣味性等方面是存在一定期待的。因此,在部分移動政務發展較為先進的地區,在改善移動政務痛點的基礎上,考慮如何運用人工智能等新興數字技術提升政務APP信息供給的質量是下一步移動政務發展的重點。
為了進一步驗證本文所提出的基于ABSA方法測量情感傾向性強度方法的有效性,借鑒李吉等[35]論文的實驗結果驗證方式,將9個省級政務APP用戶評論的情感傾向性強度測量結果與專家評分結果進行對比實驗。筆者邀請了12名具有副高以上職稱的專家、7名第三方政務評估機構工作人員以及15名高校碩士以上學歷的研究生組成專家組進行政務APP使用情感評分。
專家組具有豐富的政務研究與評估經驗,因此評分具有較大的可信度以及可靠性。實驗過程中,需要專家組成員閱讀被隨機抽取的政務APP用戶評論,并從使用動機、服務質量、系統質量以及信息質量4個維度分別打分,然后對打分結果進行加權平均,并最終匯總成情感傾向性強度得分。將其與本文計算結果進行比較得到政務APP情感傾向性差異度(具體內容見圖4)。

圖4 省級政務APP情感傾向性測量差異度
從圖4結果來看,本文提出的方法與人工方法的差異度值都小于0.4。其中,浙里辦、江蘇政務服務、天府通辦、云上貴州等政務APP情感強度測量差異較小,均低于0.25。遼事通和辦事通等政務APP情感強度測量差異度稍大,但總體仍小于0.4。由于很多服務事項在線上辦理過程中才能獲得最為真實的體驗,且專家組成員對于方面主題的內涵認知存在差異,導致專家組評分結果與情感強度計算結果稍有不同,但通過有效性測量可以發現結果分歧度較小。因此,本文運用ABSA方法對移動政務用戶評論進行的細粒度情感分析結果具有較高的可信性與有效性。
本文結合系統成功模型與期望確認模型將政務APP情感傾向性測度模型劃分為使用動機、服務質量、系統質量以及信息質量4個一級方面,運用LDA模型挖掘了政務APP評論文本的隱式方面并定義為次級方面,通過BERT模型將關鍵評論實體情感傾向概率映射到評論實體所屬方面層級中并測量情感傾向度,實現了用戶需求隱式方面的抽取與情感傾向分析的細粒度分析。同時爬取18個政務APP在線評論數據用于模型訓練,并選取9個在線評論量較多的省級政務APP進行實例驗證。
該研究在進行過程中仍存在一些局限:首先,在系統穩定性方面,根據情感傾向性指數測算結果發現,積極情感與消極情感均較為強烈。其原因,是選取的18個不同地區的政務APP在系統穩定性方面差距較大,兩級分化狀態較為明顯,在今后的研究中可以對多方面的正負情感分歧度進行進一步的橫向對比研究;其次,公眾關注的多重維度在情感上實際上是相互作用的。那么多種條件方面如何組合發揮作用,可以在后續研究中運用fsQCA的方法,以全國各地方政府APP作為研究對象,運用研究組態思想,以探究提升移動政務工作的組合策略。