□肖 進 李春燕 賈品榮
[1. 四川大學 成都 610064;2. 北京科學學研究中心 北京 100089]
近年來,隨著互聯網的興起,搜集存儲的數據呈幾何級數增長,我們已經進入大數據時代。在大數據的基礎上,人工智能獲得了飛速發展,已經成為全球關注的焦點和競爭熱點。當前,經濟社會問題日益復雜,政府治理面臨極大的挑戰,僅憑傳統的決策模式已無法有效應對日趨復雜的社會問題,而人工智能的興起為改進政府決策模式提供了條件。在人工智能背景下,政府智能決策以大數據為基礎,利用新一代數據挖掘技術,在復雜的環境和海量的數據中,解釋數據之間及數據與環境之間的廣泛聯系,實時連續地為決策的制定提供支持。目前,學術界關于互聯網科技和大數據對政府治理的影響研究相對較多[1~2],而對將人工智能運用于政府治理的研究還相對較少,本文則致力于彌補該方向上研究的不足。然而,正如斯蒂芬?霍金(Stephen Hawking)所指出,人工智能的崛起既是人類文明的推進者,同樣也可能是人類文明的終結者。事實上,人工智能是一柄“雙刃劍”。由于人工智能技術主要解決的是海量數據的處理和決策問題,因此,人工智能應用的爆發式增長為政府治理提供巨大便利的同時,也為政府決策帶來了風險,而引發風險的因素可能來自政府的內部和外部,如果政府在決策過程中不能妥善處理好這些因素,將極有可能危害政府治理以及社會穩定。另一方面,如何根據決策任務的特點,建立科學合理的智能決策模型也是當前必須解決的難題。
本文以政府治理中的智能決策理論作為研究起點,在結合影響政府智能決策的內部和外部因素的基礎上,集中研究了人工智能背景下政府治理智能決策優化問題,最后構建了基于政府內外部信息的多源信息融合模型和政府智能決策系統。
技術隨著信息的傳播而進步,大數據時代已經到來。當今世界各行業產生的數據呈爆炸性增長,每天增加的數據量超過2.5兆字節。大數據資料量大、變化飛快、種類繁雜、價值密度低以及真偽存疑等特點進一步加劇了這個時代的不確定性。然而,海量數據中包含的信息與價值卻可以幫助政府對這些不確定性進行預測,基于大數據的智能決策將取代傳統決策,成為當今時代政府治理決策的主要模式。
首先,大數據為政府智能決策提供了多元主體協同共治的新思考。從行為主義分析模型、政策網絡與政策共同體分析模型[3]、政策地形模型[4]到政策體制模型[5],政府智能決策主體正在由一元主體向多元主體轉變,治理方式由單向控制向協同共治轉變。大數據時代使政府智能決策在決策主體方面跨系統、跨邊界的特點日益明顯。
其次,大數據打破了政府控制導向的行為模式。大數據時代信息的傳播更加快速和便利,決策過程的不確定性和復雜性也大大增加[6],使政府在信息控制方面,政策控制方面以及公共物品和公共服務供給控制方面的主導地位動搖,政府控制導向的行為模式也越來越難以為繼。
首先,大數據為政府智能決策提供了實時連續決策的路徑。政府智能決策經歷了階段論模型[7]、多源流框架[8]、突變-均衡模型[9]等過程,然而這些模型往往很難預測決策過程的突發狀況。大數據時代發展起來的一系列新的技術為政府智能決策提供了有力手段,如分布式文件系統[10]、分布式數據庫[11]、批處理技術[12],以及開源實現平臺[13]等。這些技術可以為政府智能決策提供實時連續的支持,從而增加決策過程中各種突發事件的可解釋性。
其次,大數據為政府智能決策時分析事件的相關關系提供了技術支持。在傳統的政府決策過程中,往往需要基于許多的假設來處理問題中的不確定性。這些方法需要經過一些假設和推理將實際問題中的不確定因素轉化為確定因素,進而在確定性的框架內進行決策。區別于傳統政府決策流程的事后被動相應模式,大數據時代政府的智能決策流程則是搜集數據—量化分析—找出相互關系—提出優化方案的前瞻性主動研判模式[14]。
首先,大數據時代,政府決策的透明性和公平性將得到提高。傳統的決策過程以“經濟人”假設為前提,因此政府決策者缺少足夠的動力去制定最符合公共利益的政策。而政府智能決策過程可以借助大數據的技術優勢,使用數據檢索分類工具、條形碼及射頻識別[15]等方法,結合互聯網和物聯網等技術全面感知社會事項及公眾所需,采取網絡地圖[16]、標簽云[17]和歷史流圖[18]等可視化技術分析事件的發展規律,展示決策行為的全過程,進而大大增強了對決策過程的監督和對決策者權力的約束。
此外,大數據時代,以技術為導向的政府決策轉變為以價值為導向的決策。傳統的政府決策往往以效率作為評價標準,忽視了決策的公平性和民主性[19]。大數據背景下,產生了大量復雜的非結構化數據,大數據技術的應用使政府能夠有效利用這些非結構化數據,在智能決策的過程中不單單關注效率,而是更加重視民主訴求回應以及決策的公平和民主,即以價值為導向進行決策。
數據分析能力是影響決策質量的一個重要因素[20]。政府智能決策離不開數據,而這些數據往往具有來源多樣化、類型多樣化以及數據海量化的特點。這對決策人員的數據分析能力提出了更高的要求。
一方面,加強政府相關人員業務知識培訓,努力提升大數據分析能力,積極適應人工智能環境下政府智能決策工作的需要。一是注重數據歸集。積極推進大數據中心建設,扎實做好各部分業務數據歸集整理和上報工作。二是強化人才培養。特別要注意培養政府人員的大數據思維,分批次地開展大數據分析技術培訓,不斷提升他們的大數據分析實戰能力。三是推進成效轉化。要注重數據分析為政府決策帶來的效益。對具備實行智能決策的項目,要加強數據挖掘和分析能力,并將數據分析結果反饋并應用于政府智能決策實踐中。
另一方面,加強與領域專家和研究機構的合作。從大數據中獲得知識發現不能僅僅依靠計算機,專家才具有信息抽象能力。政府應當建立專業化的大數據分析中心,這些大數據分析中心應當適當聘用企業或高校的專家技術人員,借助他們的專業技能,進行政府智能決策分析。
除了數據分析能力,政府決策者的價值觀也會對政府智能決策產生影響。隨著人工智能技術的不斷發展,政府智能決策的備選方案也會呈現出多樣化。政府決策者對這些智能決策方案的選擇在一定意義上會用不同的價值標準去衡量。在進行政府智能決策過程中,相關決策人員的價值觀無法達到一致,所以無法選擇出符合所有決策者要求的決策方案。
決策者有限理性的特點決定了一些具有爭議的決策觀念存在的必然。在選擇決策方案時,很難考慮到各個方面的綜合因素,沒有一個方案是完美的。即使使用大數據技術制定的決策,政府決策者在選擇的時候也要進行綜合的可行性和合理性分析,這就要求決策者采取什么樣的價值觀。人工智能決策在很大程度上會影響公眾的隱私泄露問題,決策者在制定智能決策方案時,需要考慮到這類隱私問題,因此在問題和方案選擇時必然進行取舍。
注意力是影響政府決策的一個重要因素[21]。注意力是客觀存在的,當注意力轉變時,決策者的決策能力和價值觀會隨之改變,其選擇的決策問題和決策方案也會變化。
大數據條件下,決策者獲得的信息千變萬化,其注意力也會隨著改變,從而對政府智能決策造成了影響。如何判斷并且分析出正確的信息,需要政府決策者將注意力配置到具有價值的信息之上。只有正確地配置注意力,才能產生高效、科學、符合社會公眾利益的政府決策。如何優化政府智能決策注意力,是政府決策人員面臨的一個難題。優化政府智能決策注意力配置的途徑首先要把握政府注意力的配置向度,其次增強政府注意力配置力度,最后維持政府注意力配置的持久度。
1. 政治環境
在中國國情下,政治環境對政府決策具有較深的影響。我國目前政府決策過程日漸完善,按照國家要求在制定重大決策時加強了公眾和專家的參與度,以達到增強決策透明度的目標。在當前環境下,政府制定智能決策更應當響應國家號召,按照國家要求規范政府智能決策制定流程,制定的決策需要從實際出發,符合廣大人民群眾的根本利益。
2. 決策成本
考慮到政府部門的資金限制和人員充足等問題,一部分決策成本超出預算的決策很難被政府決策者選擇,其后果就是政府制定的某些決策可能很難符合社會公眾的利益。這就是決策成本對政府智能決策的影響。大數據背景下的政府治理,需要建立大數據中心整合和處理信息數據,此外,政府智能決策也需要投入與人工智能相關的專業人才。這些都會造成決策成本的增加,因此在政府智能決策中必然要考慮決策成本的影響。
1. 專家學者與社會公眾的影響
大數據背景下,政府決策環境和決策問題變化莫測,復雜度也日漸提升。以政府為單一主體的決策模式很難協調處理這些復雜的決策難題,因此,需要借助專家和公眾等多元參與者[22]。需要注意的是,目前人工智能在政府智能決策中正擔任著類似“專家學者”的顧問角色,通過處理相關的數據支持決策過程,并生成書面意見。然而許多決策并不能完全移交給人工智能系統,政府部門需要專家學者和公眾參與,監督人工智能系統所做決策的正確性和合理性,并需要對人工智能在其決策中發揮的作用做到盡量公開透明。
2. 網絡輿情的影響
近年來,我國的互聯網發展迅猛,特別是智能手機的普及使越來越多的網民選擇在網上發表對政府政策的看法和見解,因此,政府決策會受到網民對社會實踐的討論和質疑的影響,如果政府沒有及時反饋并處理,極大可能導致決策的失效[23]。
數據質量是影響政府智能決策的一個重要外部因素。一方面,大多數政府智能決策都是依賴于構建的模型,而模型的準確率依賴于數據質量。高質量的數據有利于政府制定出“精準”的決策,從而對社會產生積極的影響。相反,如果政府收集的數據質量太低,則極有可能制定出無法解釋甚至錯誤的決策,這些錯誤的決策將對社會產生負面的影響。另一方面,大數據時代,政府和企業的數據均呈現爆發式的增長,更新的速度也是越來越快,諸如疫情防控監督、智能交通管理等政府智能決策大都依賴于實時的數據更新。如果政府采集的數據不及時,則很難做出精準的決策,造成決策滯后,無法發揮智能決策的優勢。
決策中所采用的知識越豐富,決策就越科學有效[24]。人工智能時代的到來,知識對政府智能決策產生的影響愈發重要。政府智能決策過程中的知識應用過程包括三個方面,首先政府決策相關人員通過收集數據和分析數據,將知識進行開發,并且應用到實際決策中。然后,將知識進行轉化,轉換的客觀事實才能提高政府智能決策的能力。最后,將這些知識進行共享,對今后的政府決策提供經驗以借鑒。
隨著網絡技術的發展,越來越多互聯網或政務內部網的可用數據源相互交織,政府對信息源進行統一訪問的需求已成為了政務信息融合領域研究的背后推動力[25]。傳統的政府治理主要以各種紙質文件為信息來源,而互聯網時代的到來,使得數據獲取的渠道不斷擴充,極大地豐富了信息的主體內容[26]。同時,數據的特征、組織結構以及來源的多樣化導致政府部門從中提取有用信息并做出有效決策的難度不斷增加。人工智能背景下政府決策建模數據存儲分散且結構不同難以有效利用的問題十分突出,已成為政府治理中信息資源整合的主要障礙。為了對政府數據進行有效融合,本文提出運用多源異構融合技術對政府信息進行全方位的整合,為政府智能決策系統建設奠定基礎。
1. 政府智能決策數據源
政府智能決策數據源主要來自于各政府部門所用的政務信息資源。政務信息資源可以簡單地定義為政府相關部門和行政人員在具體政務辦理過程中所產生或接觸到的各類信息資源,它既包括政府部門的內部文件,也包括政府工作開展過程中依托第三方平臺管理、采集、存儲的各類社會資源數據,其數據結構表現更加復雜[27]。根據行政慣例,政府信息資源可以分為內部數據源以及外部數據源[28]。
(1)政府內部數據源
政府內部數據源主要有四大來源:政府網站所產生數據資源、政府業務系統所產生的數據資源、專項數據資源以及政府工作中的存檔、歸檔數據資源。政府網站所產生數據資源主要包括線上網站實時刷新所產生的前后端數據以及網站用戶訪問行為所產生的網絡日志數據等。政府業務系統所產生的數據資源主要來源于各政府部門所建立的電子政務信息系統或者信息化工程項目在運轉過程中所形成的多樣化信息資源。專項數據資源與前兩種資源有較大區別,是專門領域中所采集、檢測以及檢測的數據,通常呈現非結構化特征,如政府工作人員執法過程中產生的音視頻數據、地理地圖數據、城市氣象數據等。政府工作中的存檔、歸檔數據資源主要是傳統的線下政務管理和服務過程中以特定形式記錄和保存的各類紙質文件和電子文檔等,通常存放在政府檔案管理部門手中[29]。
(2)政府外部數據源
政府外部數據源主要涵蓋了社會信息數據資源和互聯網信息數據資源。社會信息數據資源是由大量社會組織產生的數據信息所組成的,這些組織包括:科研事業單位、行業協會商會以及其他民間組織,他們掌握著科學理論研究、行業信息、經濟運行數據等眾多資源,已成為政務信息資源中不可或缺的一部分。互聯網信息數據資源主要是因特網所包含的各類相關信息,政府有關部門履行職責需要大量網絡信息作為理論支撐,它來源于各大社交網站、自媒體平臺、移動客戶端等。政務外部數據相比于內部數據的構成更為復雜,同時也能挖掘出更多價值[30]。
2. 多源信息融合技術
多源信息融合是指源自多個信息源,將采集到的各種數據進行挑選、識別與聚合的過程。與單一信源相比,多源信息融合能夠將對象系統中更多的信息匯集到一起,更能全面地表現系統的真實狀況,提升系統識別和管理決策的可靠性,同時也提高了對復雜的信息數據處理能力的要求[31]。目前,信息融合技術可按層次分成數據級、特征級和決策級融合三個級別,分別代表著系統對信息利用和管理決策的不同需求。決策級融合使用一組分類器來提供一個更好的、無偏的結果,被廣泛運用于人臉識別、語音處理以及醫學圖像領域。特征級融合研究方法進行特征的選擇和組合時,能夠去除冗余和不相關的特征。本文將采用結合特征級和決策級的數據融合方法構建基于政府內外部信息的多源信息融合模型。
3. 基于政府內外部信息的多源信息融合模型
對政府內外部信息進行多源信息融合旨在挖掘有用信息并進行有效劃分以期輸出一致性的知識結果,其可以視為不斷訓練以獲得最優特征集的過程。將最終選擇出的特征集合融合在一起,得到相對更優的特征集合,并將其交給分類器來處理,以便得到最終的分類結果。從特征融合的定義本身可以看出,特征融合是信息融合的一個進步。為了提高融合精度,本文結合了決策融合和特征融合的概念,提出了基于政府內外部信息的多源信息融合模型,即多分類器融合模型。該模型主要包括數據預處理、特征級融合和決策級融合這三個模塊,模型流程見圖1所示。

圖1 基于政府內外部信息的多源信息融合模型
(1)數據預處理模塊
數據預處理主要包含數據清洗、數據集成和數據變換這三大部分。數據清洗主要是對政府的內外部數據中存在缺失數據、異常數據和重復數據的情況進行處理。數據集成是指分別將政府內外部數據的多個數據庫整合為政府內部數據庫和政府外部數據庫。數據變換主要是對政府內外部信息數據進行標準化、變量離散化以及屬性統一化處理,將數據轉換成便于直接處理的相應形式,有助于后續數據挖掘工作的展開。在進行數據挖掘前,先對政府內外部融合數據進行預處理,能夠有效降低數據挖掘的難度。
(2)特征級融合
特征級融合的主要目的是對特征進行約簡和去除噪聲。該方法還可以將不同域的兩個或多個特征進行合并,減少“維數詛咒”問題。特征級融合主要包括兩個模塊:特征排序和特征選擇。
特征排序先從預處理后的數據中找出所有特征,并根據每個特征的重要性計算相應的權重值,根據權重值對特征進行排序。特征排序可以通過機器學習等多種方法完成。以決策樹的特征排序為例,首先假設在單個決策樹中對每個特征分裂點的改進性能進行測度,根據性能評價結果得出屬性的重要程度。由當前節點來對屬性處理結果進行加權以及記錄的操作,當前屬性下,屬性的權重越大則越重要。最后,將各屬性在決策樹中的所有結果進行加權平均求和,即可得到該屬性的權值,以此實現對特征的排序[32]。
特征選擇通過從排序后的特征子集中選出最優特征來降低特征維度,主要包括四個模塊:特征子集的生成、評價特征子集、判斷停止準則和驗證方法[33]。候選特征子集的生成是特征選擇的重要步驟,該步驟可以通過全局最優搜索策略、啟發式搜索策略、混合搜索策略等生成特征子集。評價特征子集需要設定評價函數,依據該函數判斷特征子集的優劣,從函數類別上來說主要可以分為過濾式評價策略和封裝式評價策略。在政務信息融合的過程中,需要根據數據的自身特點,選出恰當的評價函數對候選特征子集進行篩選。判斷停止準則用于判斷特征子集評價過程是否停止,在不滿足先前設置的搜索停止條件的情況下,特征搜索過程將一直運行。最后,在政府內外部數據上驗證特征子集的優劣,將進行上述操作的結果作為訓練數據,讓分類器在該數據集上進行訓練以及測試,再將分類結果與未經特征選擇的分類結果進行相應的比較,以便選出更優的分類器。
(3)決策級融合
決策級融合是指對特征級融合階段選出的各分類器進行融合,可選方式有分類器融合和分類器選擇兩種方式。在分類器融合中,為每個分類器提供完整的特征空間信息,并將不同分類器的輸出進行組合。而在分類器選擇方法中,每個分類器都是特征空間中某個特定領域的專家,局部專家單獨決定集成的輸出。由于特征選擇已經將特征空間進行了有效劃分,不再需要進行局部訓練,采用分類器融合方案更適合本任務。本文選擇對分類器進行排序來實現分類器融合。分類器排序根據每個分類器置信度的降序進行排序。分類器的決策被表示為類的排名,這樣它們就可以在不同類型的分類器和問題的不同實例之間進行比較。在多個分類器的類排序輸出時進行決策級融合,包括采用類集約簡方法[34]。
類集約簡方法的目的是考慮通過盡可能減少類的數量來進行分類器融合,但確保正確的類仍在分類器集中。該方法嘗試找到最小化分類器集和最大化真實類所占概率值的權衡。這可以通過兩種方式實現:第一類,鄰域相交,首先根據訓練集中最壞情況下正確類的排序確定分類器領域,隨后將所有分類器中正確類的最低排名作為閾值,只有排名靠前的分類器才被選擇,以此來剔除閾值最低的冗余分類器;第二類,鄰域聯合,將訓練集中最壞情況下所有正確類的最大排序值作為分類器的閾值,這樣很容易找出冗余的分類器。
政府智能決策系統是將人工智能嵌入傳統決策支持系統而構建的專家系統,它根據政府涉及的內部信息和外部信息、各類分析模型和各種基本知識定律,利用人機交互方式輔助政府人員進行決策,有望進一步促進政府管理者提升政務治理的水平。政府智能決策系統結構如圖2所示。

圖2 政府智能決策系統結構
政府智能決策系統為決策者提供問題分析、模型構建和決策結果可視化等功能,有利于提高決策質量。隨著人工智能的不斷發展,企業將提高決策系統的智能化水平作為發展目標。雖然特定領域的專家系統已經得到了不同程度的發展,但是智能決策系統仍然處于初級發展階段。開發政府智能決策系統對政府部門和社會組織的工作開展具有重大意義[35]。
人工智能應用的爆發式增長為政府治理提供巨大便利的同時,也帶來了一些新的挑戰,僅憑傳統的決策模型已無法有效應對人工智能背景下的政府治理問題,因此,在人工智能的背景下展開對政府智能決策優化的研究已刻不容緩。本文首先從政府治理中的智能決策理論研究入手,接著分析了影響政府智能決策的內外部因素,最后構建了基于多源數據融合的智能決策支持系統,實時、連續地為決策制定提供支持,從而提高政府決策的效率與科學性。