





關鍵詞:社會訴求數據;政務決策;四診合參;數據價值挖掘
DOI:10.3969/j.issn.1008-0821.2024.11.008
〔中圖分類號〕D63-39 〔文獻標識碼〕A 〔文章編號〕1008-0821(2024)11-0080-10
隨著技術發展與數字政府建設的推進,政府的應急決策模式逐步從“經驗判斷”轉向“數據驅動”,各級各類的政務數據成為賦能決策的重要資源。作為典型的政務數據,社會訴求數據中蘊含著公眾的意愿、觀點和主張,為政府決策提供了可信、可用、可得的豐富數據來源。
相較于通過問卷、訪談等調研形式得到的民意數據,政民互動平臺的訴求數據由公眾自發生成,具有體量大、實效性強、真實客觀等典型特征,并且作為社情民意和熱點事件的載體,是社會風險的強感知器,政府可以通過數智技術挖掘其中蘊含的熱點、難點、堵點問題,識別潛在社會風險并賦能于預警及防范。當前已有部分政府和第三方機構積極開發社會訴求數據挖掘平臺,如“城感通”城市治理與風險防范系統、12345社情民意分析平臺等[1],但這些平臺側重于對數據單方面特征的統計分析與簡單呈現,數據挖掘的全面性有待提升,且對受眾認知規律的考慮不足,導致數據挖掘與決策應用之間存在斷層。因此,如何遵循數據特征并結合受眾認知邏輯,以系統化的形式全面多維揭示數據內涵并有效賦能于決策成為亟待突破的重點。
鑒于此,本文借鑒中醫學領域的“四診合參”理論,從“望、聞、問、切”4個階段構建社會訴求數據分析框架,在理論上為系統化挖掘社會訴求數據提供新的研究思路和理論模型,實踐上為社會訴求數據賦能政府決策提供一套全景化方案與方法支撐,從而輔助發揮社會訴求數據對社會治理與決策服務的獨特價值。
1相關研究與問題的提出
1.1社會訴求數據
社會訴求數據是近年來伴隨著政務熱線發展而興起的社會感知類數據,指公眾通過特定渠道,面向政府表達意愿、觀點和要求時產生的大規模數據[2]。社會訴求數據的傳統渠道為政務熱線,如12345服務熱線數據,在互聯網的發展下訴求渠道愈發多元,逐漸向門戶網站、社交新媒體等網絡平臺傾斜。
目前圍繞社會訴求數據展開的研究主要包括3個方面:①社會訴求數據價值探究。如鄭躍平等[3]認為,政務熱線服務體系已逐步發展為城市數據共享樞紐;KumarH等[4]、孟天廣等[5]認為,社會訴求數據能夠推動城市治理的智慧化轉型升級。②社會訴求數據挖掘分析。如雷玉瓊等[6]、孫宗鋒等[7]、胡廣偉等[8]使用文本分類、情感分析、統計分析等方法挖掘公眾訴求;李桂華等[2]探究基于社會訴求數據的情報體系構建路徑,并提出由數據層、方法層、業務層構成的分析框架,剖析社會訴求數據在“情景—應對”決策中的應用過程[9];張莉曼等[10-11]通過構建公眾訴求故事化描述框架,實現公眾訴求信息的有效傳遞。③基于社會訴求數據的決策。XuL等[12]采用局部自適應方法建模,預測311熱線數據在時空維度的典型需求;ChatfieldAT等[13]構建了311熱線數據與公共價值的協同耦合機制,旨在賦能智慧治理與服務決策。
盡管目前關于社會訴求數據的研究已較為豐富,但仍有以下問題值得深入探索:一是數據挖掘的深度不足,通常只是對1個或幾個維度進行分析,缺乏全景化數據挖掘體系。二是多將社會訴求數據視為一般性短文本,較少從社會訴求數據特征與價值出發探究數據處理框架。三是社會訴求數據對決策的賦能體系尚不清晰,缺乏相應的理論支撐。總體來說,在特定理論指導下對社會訴求數據賦能決策的鏈路進行深層次、系統性分析的研究還十分匱乏。
1.2四診合參理論
四診合參是中醫診斷學的重要思想,指通過望、聞、問、切4種方法從不同角度收集病情資料后,對信息進行綜合分析從而對病癥做出科學判斷[14]。四診從4個不同的方面對“病癥”數據進行收集、加工與提煉,這種逐層遞進的信息處理方式契合DIKW模型中“數據—信息—知識—智慧”的轉化鏈路[15],為數據處理與決策應用提供了整體性的視角與思路。
四診合參最初多用于規范醫生對病患的全方位診斷流程,但隨著相關研究的不斷深入,部分學者也將其用于社會治理、風險評估等問題的研究,在“四診”的基礎上做出綜合性的決策判斷,如于峰等[16]借鑒“望聞問切”流程提出綜合風險評估框架,用來推斷級聯風險的演化態勢。由于四診合參不僅強調診斷已有疾病,還強調預防未有之病,因此,胡峰[17]基于“病灶點”錨定的邏輯,解構了信息疫情治理在治未病四階段存在的困境,并提出信息疫情治理的紓困方略。任騰飛[18]基于“望聞問切”理論,以寧波市檔案局為例梳理了服務農村基層社會治理的參考路徑。李佳[19]提出,借鑒“望聞問切”的中醫思維對審計信息進行全方位的審理,以提高審計質量和審理工作效率。
四診合參理論強調對“病癥”信息進行全面收集與追根究底的分析,從而達到追本溯源、防患未然的目的,這與數據挖掘和社會治理的目的不謀而合。因此,該理論可以為數據驅動的社會治理提供一個理論框架,為數據挖掘價值發揮與決策賦能提供系統性的指導鏈路。然而,目前將該理論應用于數據價值挖掘的研究尚處于起步階段,且缺乏在政務數據分析方面的實踐探索。
綜上所述,社會訴求數據具有豐富的社會治理價值,對政府的數字化轉型和治理能力提升有重要意義,而四診合參理論可以為社會訴求數據的價值挖掘與決策賦能提供整體性的指導框架,為社會訴求數據的分析、呈現和決策應用提供有章可循的研究范式。
2社會訴求數據賦能決策的理論分析框架
2.1四診合參對社會訴求數據價值挖掘的效用分析
社會訴求數據的挖掘過程也是從海量數據資源中提取核心信息并賦能于政務決策的過程,一般包括數據的獲取、處理、分析與應用四大流程[10]。而四診合參理論強調從整體視角審查診斷的對象,以分層遞進的形式對診斷對象的特征與問題進行全景化掃描,將其應用到社會訴求數據挖掘方面能夠有效規范數據處理流程,實現訴求數據的價值增值,具體來說有如下優勢:
1)有助于全景認知訴求內涵。《醫門法律》中提出“望聞問切,醫之不可缺一”,即在臨床運用中需將四診有機結合,從而全面掌握病灶點,做出正確判斷。在社會訴求數據價值挖掘時也需將各個維度處理的結果全面整合,綜合審查民生訴求點,系統感知訴求表達。
2)有助于深入洞察核心問題。四診合參的分析過程具有層次性,為臨床診斷提供縱向邏輯依據。因此,基于望聞問切的價值挖掘,是從數據到信息到知識,再到決策的層層深入的過程,便于政務工作者厘清問題脈絡,深度把握民意民聲。
3)有助于提升政務決策效率。四診合參中“望”“聞”“問”“切”4個流程符合由簡單到復雜、由一般到具體的個體認知規律,因此,將其應用在社會訴求數據分析方面可以有效減輕政務工作者的數據認知負荷,彌合數據處理與應用之間的鴻溝。
綜上,將四診合參理論運用在社會訴求數據價值挖掘上有助于全景洞察數據內涵,激活政務數據價值,為政務數據挖掘過程中的處理與集成、分析與解釋以及數據賦能決策提供系統性思路和研究框架。
2.2社會訴求數據賦能決策的四診合參理論分析框架設計
根據四診合參思想可知,社會訴求數據分析應包含“四診”與“合參”共5個環節。其中,“望”注重整體化全息信息的集成,“聞”“問”“切”則側重事實性信息的揭示、判斷性信息的聚合以及預測型信息的匯總,最后“合參”整合四診結果并提出決策建議。從四診合參理論中“望”“聞”“問”“切”的中醫釋義出發,結合社會訴求數據特征與政務決策目標,提出基于四診合參的社會訴求數據分析理論框架,如表1所示,為社會訴求數據賦能政務決策提供系統性理論依據。
2.2.1望表而知里——態勢感知
望診通過綜合觀察病人的神、色、形、態、舌苔等外部特征來初步測知內部病變。這一環節強調的是信息的全息感知,因此,本階段引入12345熱線、網絡平臺與線下信訪數據,基于多源社會訴求數據整體勾勒城市治理畫像,使政務工作者綜合感知城市運轉過程中的典型問題與治理態勢,形成初步認知預判。該環節以問題為導向,運用統計分析、顯著分析、對比分析等提取特定時間、空間范圍下的突出問題,進行圖表組織后以“治理一張題”的形式全景化呈現治理態勢,使政務工作者了解公眾訴求的表面癥候,為后續的深入處理做鋪墊。
2.2.2聞聲而知意——民聲聚合
聞診是綜合聽覺與嗅覺以了解病情的診察方法,本階段醫生進一步明確患者的病灶點,社會訴求數據中民生訴求主題可視為社會病灶點的集成反映,因此,本環節對訴求主題進行挖掘,包含焦點分析與主題分析兩方面。焦點分析即識別被廣泛提到的訴求焦點,明確當前公眾關注的關鍵問題,主題分類即將描述相同或相似的訴求歸納為同一類簇,探究各類訴求所涉及的具體問題。以上兩方面輔助政務工作者進一步認知訴求問題靶點、了解民聲所向,對公眾訴求涉及的社會痛點問題進行診斷,明確城市治理方向,為后續的處理和決策奠定基礎。
2.2.3問疾而曉情——民情識別
問診階段詢問病人的主觀體會,獲取病人自述性的病態感受。醫生通過詢問病人的痛苦程度和關聯疾病史來判斷病情的輕重緩急與深層信息。本階段主要探究民意的主觀體驗,即從文本角度進行情感探測與關聯發現。情感探測通過評估文本中的情感傾向,篩選出緊急度高、亟待解決的訴求,輔助政務工作者把握決策重點;關聯發現從語義角度對問題進行拓展和延伸,輔助政務工作者發現其他潛在問題,形成民情主張的全息投影。
2.2.4切癥而明危——民憂研判
切診是用手觸按患者的動脈脈搏及其他部位,測知脈象變化及有關異常征象的診法。切診通過脈象等推測病情,因此,該階段主要進行預測分析,即針對當前問題預測后續的可能性風險,包括對現實性風險的情報預警和對可能性風險的前瞻預測。情報預警監控風險因素的變動趨勢、評估各類風險等級并發出預警信號,前瞻預測分析事件未來一段時間的影響范圍、輿情走勢。本階段在前續分析結果的基礎上預測后續可能發生的問題,以實現“未病先防”“未訴先辦”,可以幫助政務工作者提前進行資源調配和方案規劃,提升社會訴求數據的決策賦能價值。
2.2.5合參而施策——決策治理
“合參”綜合利用四診結果診斷病癥,給出病癥判斷和處方依據,因此,本階段主要為決策提供參考,包括智能診斷和決策參考。智能診斷總結望聞問切結果,通過要點總結和雷達圖等形式,簡潔、清晰地開出“四診”后的“病例單”,使政務工作者高效獲取當前城市運行中存在的問題。決策參考包括智庫推理和決策建議。智庫推理綜合案例庫和知識庫,案例庫根據問題關鍵詞匹配出以往處理方案,知識庫根據專家經驗給出決策建議。智庫動態可更新,最終決策方案和新的專家建議將實時記錄,實現數據的更迭。此外,系統根據智能診斷結果和智庫數據進行推理,自動給出決策建議,提供“對癥下藥”的診治建議。本階段整合了問題現狀和相關經驗,為政務工作者提供了全面、具體的社會問題診斷結果,動態更新的智慧錦囊,以及可參考、可復用、可更新的診治建議,為數據驅動決策提供切實可行的指導方案。
3社會訴求數據賦能決策的技術框架
“四診合參”結構為社會訴求數據的挖掘過程提供了整體性、遞進式的處理模板,如圖1所示。
從橫向來看,望、聞、問、切規范了每一環節挖掘的重點,關聯社會訴求數據蘊含的不同維度信息,形成全景化特征集合,并且挖掘的內容從事實性信息到判斷性信息再到預測性信息,符合人們對信息認知逐步深入的過程。從縱向來看,四診合參串聯起“表象—癥候—診斷—取藥”的遞進過程,使數據洞察層次逐步深入,形成從發現訴求問題到提出解決方案的完整處理框架,能夠有效彌合數據處理與應用之間的斷層。結合“數據—信息—知識—智慧”的數據處理過程,提出基于四診合參理論的社會訴求數據價值挖掘技術框架,如圖2所示。
3.1基于態勢感知的望診
態勢感知旨在從數據角度對整個社會治理系統的運轉態勢進行綜合感知,強調從多源數據中凝聚數據核心特征并進行集成呈現,使政務工作者產生宏觀印象,整體感知社會運轉過程中的態勢和典型問題。具體來說,首先從多渠道一體化采集社會訴求數據,形成原始數據庫,其次定義字段提取規則,通過規則匹配等從原始數據集中獲取所需的文本型、標簽型、數值型、時間型數據,并將提取出的元素存入特征信息庫,為后續分析提供原始素材。在此基礎上進行數據特征分析與可視化,形成治理一張圖,主要包括:
1)統計比較。統計訴求總量與類別、回復率、滿意率、處理部門等基礎信息,在此基礎上進行比例、比率、程度等方面的比較分析,反映數據在時間、空間及各事物之間聯系的差別,繪制成直觀可視的圖表,高效揭示關鍵數據內涵。
2)顯著判斷。基于統計比較的結果,抽取出具有高頻、高權、高關注的事件、部門與主題,將顯著結果匯集整合,形成以顯著問題、高頻事件等為導向的視覺圖像,高效揭示多源社會訴求數據展示的核心問題。
3.2基于民聲聚合的聞診
本環節旨在挖掘社會訴求主題,輔助政務工作者洞察社會訴求焦點。一方面,通過計算詞頻共現揭示訴求焦點,利用Tableau等工具進行可視化;另一方面,采用BERT進行主題建模,劃分訴求主題并繪制主題關聯圖譜,具體來說:
1)焦點呈現。運用TF-IDF權值法抽取原始文本中公眾廣泛提及的關鍵詞,繪制詞云圖以直觀展示訴求問題的分布情況。通過詞云圖,可以快速了解公眾關注的焦點和熱點問題,為進一步分析和處理提供參考。
2)主題圖譜。BERT模型[21]能夠在大規模的文本數據上進行預訓練,在具體任務上進行微調,適用于海量社會訴求數據的主題分類任務。以《政府公共服務平臺訴求分類與代碼》[22]文件為依據,選取部分原始數據進行人工標注,并劃分訓練集和測試集用于BERT模型訓練,完成訓練后進行剩余數據的主題識別,最后結合主題建模以可擴展的圖譜形式呈現主題類簇。
3.3基于民情識別的問診
本環節旨在通過識別訴求的情感傾向和強弱程度來判斷事件的輕重緩急,通過主題詞的語義關聯對關鍵詞進行解讀與延伸,輔助發現更多問題。首先使用否定詞表、程度副詞表和情感詞表構建情感詞典及匹配規則[23],利用情感詞典及匹配規則進行文本匹配和加權統計,計算出情感值。在此基礎上進行訴求情感探測與關聯分析,具體來說:
1)訴求情感探測。根據訴求情感傾向值繪制情感傾向分布圖,根據訴求絕對值大小劃分情感強烈程度,結合主題占比進行可視化展示,從而更全面地了解公眾對特定問題的情感傾向和強度,更好地了解公眾訴求強度。
2)語義關聯發現。使用Apriori算法[24]進行關聯分析,找出頻繁項集并用Association_rules方法計算關聯規則,挖掘出與當前焦點問題關聯程度較大的相關主題,從而定位出可能發生的其他問題,以便于預先對關聯問題進行干預和防范。
3.4基于民憂研判的切診
民憂研判是“未訴先辦”的前提,旨在追蹤訴求發展趨勢,輔助政務工作者事先對可能發生的情況進行部署和干預。本環節主要由事件預警和風險預測兩部分構成:
1)事件預警。一般來說,負向情感越顯著越容易產生聚集性的風險問題,因此,預測情感值可以提前感知并預防風險。對整體訴求和不同主題的訴求進行情感值監控,按照負向情感值權重排序,識別出高—中高—中低—低的分層預警模型。
2)風險預測,在風險值探測基礎上,使用LGBM[25]方法結合時間序列進行預測,得到情感真實值、擬合值和預測值時間序列折線圖,直觀展示情感值變動,預知后續可能發生的風險。
3.5基于知識組織的合參
知識組織是指對知識客體進行整理、加工、揭示、控制等一系列組織化的過程[24,26]。“合參”強調將四診結果凝練展示,同時組織、匹配出既往經驗與專家智慧。包含以下兩方面:
1)智能診斷。對四診結果進行歸納,為政務工作者呈現決策要點。總結訴求條數、類型、高頻詞、主題等形成事實性信息,挖掘訴求不同主題及不同主題情感值形成判斷性信息,追蹤訴求情感趨勢和焦點問題趨勢形成推測性信息,以上3個層面為決策提供了由表及里、層層遞進的參考依據。
2)決策參考。從蘇州市人民政府官網爬取專家問答、過往訴求的相關數據,設置可查詢的專家智慧庫和典型問答庫,為政務工作者提供處理意見和答復參考,提高民生訴求的處理與決策效率。同時,結合歷史經驗數據庫進行推理給出核心訴求要點,提供決策建議的簡潔報告,輔助政府工作者明確下一階段的工作重心。
4實驗過程與原型系統搭建
4.1數據獲取與預處理
采集蘇州市人民政府官網政民互動模塊2022年1月1日—2023年7月1日的訴求數據為樣本,包含信件類型、來信時間、來信主題、來信內容、受理單位、回復狀態、回復內容、回復時間、回復人、公眾評價共10個字段,預處理后剩余7421條數據。按照上文提出的技術框架,對社會訴求數據運用“四診合參”進行“診斷”。
4.2原型系統呈現
原型系統圖能夠直觀展示系統界面的概念原貌與操作端口,為研究設計提供可視化指導方案。按照上文提出的思路方法進行數據處理,并將處理結果嵌入原型界面。界面組織過程中遵循尼爾森十大可用性原則[27],通過設置布局使圖表符合格式塔原理[28]。
4.2.1態勢感知
本環節對應四診合參中的“望診”,旨在展示社會運轉系統的整體態勢,輔助政務工作者產生宏觀認知,如圖3所示。整個頁面以問題為導向,按照“中間—兩端”的設計邏輯,頁面中心位置提供總體概覽、自然災害、社會民生、經濟狀況、治安情況5個端口,以蘇州市城市地圖的形式呈現各區域典型問題,以“社會民生”為例,揭示事件要點、地域、關注度與民眾反應,按照訴求處理數量對責任部門排序;頁面左側展示訴求數據的來源渠道,可以看出當前時段累計收到7421條數據,涉及58個責任部門,平均回復時間為4天,并提示政務工作者重點對待投訴類訴求;頁面右側集中提示政務工作者高頻集中在證件辦理、辦公時間咨詢等方面,群眾廣泛關注公積金辦理、交通出行等問題,動態展示最新訴求信息,使政務工作者能夠系統感知城市運轉的整體狀態以及出現的痛點、堵點問題。
4.2.2訴求診斷
本環節包含民聲聚合、民情識別、民憂研判3個環節,分別對應四診合參中的“聞診”“問診”和“切診”,3個步驟層層遞進,共同作用于訴求數據中關鍵問題的深度追蹤。如圖4所示,圖中3模塊由左及右推進,從民聲聚合中可以看出小區、物業、交付、垃圾等問題是公眾訴求焦點,從主題圖譜中發現訴求涉及民政社區、住房保障等8類問題,每個主題下展示若干關鍵詞,如民生服務主題中的關鍵詞有小區、單位、辦理等。從民情識別中可以看出民生服務類訴求整體情感偏正面,且負面情感強度分布呈正金字塔結構,即情感值越高訴求數量越少,說明雖然訴求的負面情感顯著,但民眾情緒尚為穩定;通過對咨詢、監督等詞的語義關聯分析,提示政府未來重點關注政府管理、統計數據等方面的問題與服務。從民憂研判中可以看出,預警問題主要存在于民政社區與住房保障,提醒政務工作者優先關注。前瞻預測旨在對一定時期內的總體風險態勢進行監控與預測,該階段訴求情感值在10附近波動,呈正面,預計后續3天情感值穩定在11左右,整體訴求情感狀況良好。
4.2.3決策治理
本環節對應四診合參中的“合參”,旨在總結四診結果并提供決策參考,界面包含智能診斷、智庫推理和決策建議三大模塊,如圖5所示。智能診斷模塊為政務工作者提煉訴求、洞察結論,如以文本摘要的形式提煉數據總量、類型、關鍵詞以及主題分布概況,并歸納總體風險情況、動態趨勢以及下一階段的可能性問題。智庫推理模塊引入智庫數據動態展示專家建議,其智能問答功能支持政務工作者自主進行問題查詢與深度分析,實現數據的靈活洞察與交互探索。決策建議模塊整合前序環節洞察出來的核心結論,結合智庫數據庫進行推理,自動給出優化點、維持點及風險點,關聯各責任部門并提出針對性應對策略,明確當前階段的責任主體并厘清任務的輕重緩急,實現各部門的協同應對與整體治理。
上文原型系統界面從不同角度展示出社會訴求數據中蘊含的關鍵信息。其中,“望診”階段主要展示全局性社會運轉系統,使政務工作者對整體態勢實現初步感知,“聞診”“問診”“切診”對訴求內容的主題、情感與趨勢進行深入判斷與前瞻預測。四診完成后,“合參”階段進行歸納總結并提供相關決策參考。界面排版采用圖文結合的形式,便于政務工作者捕捉訴求重點,并且界面以概覽—探究—應用的邏輯展開,符合個體由淺及深的認知規律。
5結語
當前,我國社會治理正經歷著數字化、現代化轉型,政府數據日益豐富與多樣化,社會訴求數據價值日益凸顯。在此背景下,本文創新性地將中醫四診合參思想運用到社會訴求數據洞察方面,為數據挖掘體系構建提供系統性指導。在理論上,本文構建了基于四診合參的社會訴求數據價值挖掘框架,拓展了四診合參理論的應用場景,并為社會訴求數據洞察提供參考思路;在實踐上,本文提出了社會訴求數據挖掘的技術框架,為社會訴求數據價值發揮提供了切實可行的應用方案。
由于目前從中醫視角進行數據挖掘的文獻較為匱乏,因此,本文側重進行數據分析框架搭建與可行性探索,未來將進一步擴展理論模型的深度,探究多場景視角下的政務數據挖掘體系構建,積極推動本研究應用落地。