楊二慧 古 劍
2023 年1 月9 日,習近平總書記在中國共產黨第二十屆中央紀律檢查委員會第二次全體會議上發表重要講話,強調“要把不敢腐、不能腐、不想腐有效貫通起來,三者同時發力、同向發力、綜合發力,把不敢腐的震懾力、不能腐的約束力、不想腐的感召力結合起來。進一步健全完善懲治行賄的法律法規,完善對行賄人的聯合懲戒機制。嚴厲打擊那些所謂‘有背景’的‘政治騙子’?!雹?023年7 月25 日,刑法修正案(十二)草案提請十四屆全國人大常委會第四次會議審議。該草案加大了對行賄犯罪的懲治力度,同時增加了懲治民營企業內部人員腐敗相關犯罪的條款,進一步發揮了刑法在一體推進不敢腐、不能腐、不想腐體制機制中的重要作用。②由此可見,我國對腐敗問題秉持零容忍態度。近年來,大數據技術迅猛發展,腐敗犯罪發生場域也隨之逐漸從物理空間向虛擬空間轉移,網絡的技術驅動性與普及性使我國社會進入了不同于傳統社會的網絡社會形態,并對社會治理體系和治理能力現代化提出了新要求。③在此背景下,如何推進腐敗治理現代化建設成為不可回避的議題。
大數據的情報研判、風險預警、可視化信息分析等技術為我國科學地作出腐敗犯罪防控決策插上了翅膀。關于大數據技術在腐敗犯罪治理現代化的具體應用,學者們莫衷一是。持否定論的學者從個人隱私與人權保障等角度質疑其本身的合法性;持肯定論的學者則認為大數據技術不同于傳統的理論模式和闡釋方法,其依托于技術能夠提高犯罪防控決策的科學性與精確性,并最終取代傳統的犯罪防控模式進路;持折中觀點的學者認為大數據技術方法為傳統的犯罪理論模式提供了新的闡釋進路,并必將引起傳統犯罪學研究范式的變革。但是傳統的犯罪學理論在數據導向的犯罪防控模式中始終處于理論假設與方向引導的地位,大數據技術的運用與傳統的犯罪學理論模式之間并非沖突關系,而是可以并存且互動的合作狀態。過去延續至今的腐敗治理是被動的、靜態的事后處置模式,而大數據技術的出現為防線的遷移提供了條件。當前,腐敗治理的模式正在向動態監督方向發展?;诖朔N理念,本文擬從大數據推進腐敗治理現代化的亮點、難點和發力點三個方面展開論證,希冀提出中國方案。
在長期的反腐倡廉建設過程中,我國逐漸形成了刑法、刑事訴訟法以及黨內法規、紀律等一系列法律、法規約束機制,實現了權力監督約束理論、制度反腐理論等諸多治理腐敗犯罪方面的理論突破,監察委員會的成立更是我國腐敗治理工作的一大創新與亮點。但是,隨著腐敗犯罪呈現出的智能化、隱蔽化等特點,這種主要局限于定性的研究方法與因果關系探討的政治體制改革并沒有脫離傳統思維的束縛,仍具有一定的局限性。而以計算為中心的理念逐漸轉變成以數據為中心,形成數據思維方式的大數據治理腐敗模式,其能夠打破傳統反腐模式的思維定式,是人類在不斷探索自然、研究社會中發現的區別于實驗驗證、理論推導和科學計算的新型研究范式,即“第四范式”。大數據技術相對于傳統的“小數據”,具有“海量數據、類型多樣、處理快速、低密度”的特點,遵循“樣本就是總體、重視相關關系、允許不精確”的思維方法,區別于傳統的重視因果關系,追求精確性的思維。其避免了小數據下主觀偏見與客觀存在的障礙,具有預測性。它能夠提高腐敗犯罪防控決策的效能,為以政治體制改革為主導的反腐路徑提供側翼,是腐敗犯罪治理方法與技術上的創新。④
大數據時代下,云計算、物聯網以及Web 等技術飛速發展,任何行為人的行為都不再是一個簡單孤立的事件,而是在經過系統的數據收集、分析后,形成一個相互聯系的信息鏈,如電商平臺能夠通過客戶的消費情況分析出其消費偏好、消費結構,甚至未來的消費傾向;網絡視頻客戶端能夠通過分析節目的播放量、網友們的評論等內容獲取大眾的精神需求與觀看口味。具體到腐敗犯罪,各種結構化與非結構化數據、權力機關內部數據與外部數據拓寬了信息來源,增加了數據源的廣度與深度。行為人的社交朋友圈、通信記錄、交易記錄等客觀的個人生活行為,以及官方部門建立的視頻監控、互聯網記錄和網民通過各種社交平臺提供的舉報線索等信息在數字化的時代將得到永久性的保存。對信息收集分析并挖掘其內在的價值之后可形成易于獲取的電子證據,從而可成為行為人涉腐的關系圖。因此,大數據反腐模式下腐敗線索的收集不再局限于公民的舉報或紀檢部門獲取個案信息,而是對所有數據軌跡的全面覆蓋,節約了人力、物力成本,適應了當下腐敗治理的現實情境。
反腐敗不是世界上某一個國家或特定時期內的問題,而是全球范圍內一直普遍存在的問題。隨著社會不斷發展,腐敗的形式和特征變幻多端,但是并不代表我們無計可施,而是要發現腐敗的本質和規律并進行有針對性的預防、懲治。以古典犯罪學理論為基礎的傳統腐敗犯罪預防理論主張通過刑罰懲罰犯罪人,從而預防其再犯并對其他人形成潛在的威懾。事實證明,這種犯罪威懾理論不僅成本高昂、無助于減少犯罪、不利于預防未然;而且以線索為導向的傳統反腐模式通常就線索尋找線索,隨著立案數量的增大、審查周期的縮短、取證難度的加大、腐敗樣式的多樣化與隱蔽化,已經越來越表現出力不從心。即使近些年卓有成效的網絡反腐依然是以公眾舉報信息的主動披露為開端,權力機關卻處于信息的末端,且面臨信息真假難辨的困境,因此其仍然屬于制度反腐的范疇。
大數據反腐模式的出現為發現腐敗犯罪規律并有效作出預測提供了可能。腐敗犯罪的本質是權力的擁有者以權謀私,進而導致權力異化的結果。因此,腐敗治理的根本途徑是保證權力在法律所規定的范圍內行使,避免權力的異化。現代公權力的行使,無論是權力的決定、執行,還是權力的監督,始終處于動態的時空范圍。其所涉及的資金、人事、項目等在開放的大數據時代都可以通過各種正式與非正式的路徑獲取,并在經過分析、鑒別之后形成系統的、具有價值的數據信息,繪制出規范的權力運行軌跡圖,一旦發現權力延伸的觸角,便能夠及時發現異常并予以阻止。另外,治理腐敗犯罪的有效路徑是尋找到腐敗犯罪的規律,從而達到標本兼治的目的。通過對互聯網上公職人員的評價信息去偽存真,并就其個人信息變動情況進行整合,大數據能夠迅速透過零碎的現象找到他們之間的普遍聯系,并揭示其背后蘊含的規律性。
傳統的反應式(Reactive)調查有諸多弊病,例如調查基于舉報而驅動,因此未被民眾或內部舉報的招投標項目不會引起偵查機關的重視。絕大多數偵查機關缺少科學和高效的案件篩選調查評估方法和流程,調查主要依賴于主觀經驗展開。這導致一方面多數案件因缺乏實質性證據而難以指控,另一方面偵查機關在時間、人力和物力上的投入成本顯著飆升。而基于機器學習的大數據反腐技術不僅可以通過既存案件歸納關聯性特征,而且可以提供可量化預警和識別精準度指標,提升腐敗犯罪的預防能力。目前算法在電商反作弊、金融反欺詐和風控領域用于對可疑借貸、交易、商戶、償還能力等實體的預警和識別。算法能夠通過數據分布特點高效地自動學習,再根據這些差異不斷對自身模型進行迭代訓練,最終形成最優的預測模型,實現對未知標簽數據的預測。例如世界銀行(The World Bank)研發的可疑腐敗合同識別算法,將可疑案件指控率提升了約84%。究其原因在于,世界銀行反腐敗調查由原先依靠民眾或內部舉報驅動逐漸轉向由算法以特定方式對舉報案件進行分級和排序推動,進而為調查人員推薦高優先級的案件。此類合同算法的訓練涉及諸多維度的數據,需要通過人工分析和特征工程篩選出一千四百多個特征,這其中包括合同總金額、項目地址、供應商名稱、合同所處行業(如醫療、建筑工程、信息工程等)。
以招投標腐敗案件為例,可以將存在犯罪嫌疑的特征歸納為三個方面。其一,在涉嫌腐敗的招投標中,供應商通常會以低定價提高中標成功率,但在中標后會陸續申請幾次追加資金。其二,中標供應商的工程啟動日與合同中標日間隔時間較長。其三,在特定某一個行業中標的供應商在其他的行業中標。基于這些特征,在算法訓練(包括隨機森林、邏輯回歸、Ada Boost、SVC、Gradient Boosting 和K 最近鄰)和對比后,最優模型Gradient Boosting 能達到70%至80%的推薦精確度。這表明在司法資源有限的情形下,最優模型推薦存在腐敗風險的合同中會有70%到80%通過偵查收集實質證據,最終形成有效控告。基于機器學習的腐敗合同的自動識別和推薦系統能夠有效地為調查機關集中調查資源到腐敗可能性最高的案件上。結合現有的其他案件信息,對自動識別、預警和推薦系統進行研發,可輔助調查人員高效捕捉和分析腐敗情報,優化司法資源配置。
大數據時代下,網絡是公眾表達民主意識的重要平臺,亦是社會公眾思想情緒的蓄水池。一旦對涉腐網絡輿情處理不好,很可能會造成現實社會的不穩定。近年來,隨著人們民主政治參與積極性的提高,人們在期望實現司法公正的同時,還要求以看得見的方式實現程序上的正義,部分案件易因信息的不對稱而引起網上熱議。第十七屆中央紀委五次全會提出,“拓寬群眾參與反腐倡廉工作渠道,加強反腐倡廉輿情網絡信息的收集、研判和處置,積極回應社會關切”。就傳統反腐模式來說,權力機關通常出于犯罪黑數的存在、國家機關工作人員廉潔形象及政府權威的維護等原因不公開或選擇性公開腐敗案情,這會加劇公民對權力機關的信任危機。即使在網絡反腐模式下,網民的不理性、網絡信息的魚龍混雜、政府機關的超常規回應等都會促使公眾輿情危機的爆發。
因此,通過大數據了解公眾在網絡上關于腐敗輿情信息的發展態勢對于整個腐敗犯罪的治理至關重要。大數據技術能夠有力地促進網絡反腐輿情的監控和預測,這主要體現在:其一,科學、有效地管理涉腐輿情。作為全球大數據的權威,巴拉巴西認為,“93%的人類行為是可以預測的,人們將生活數字化、公式化以及模型化的時候,我們會發現其實大家都非常相似,人類行為看上去很隨意、很偶然卻極容易被預測?!雹荽髷祿⒆阌谑占?、整理、挖掘大量涉腐信息背后的價值,通過信息之間的相關性預測涉腐輿情的發展趨勢,從而使得涉腐輿情的管理更具有科學性、時效性。其二,監控的動態性、靈活性。通過對各種網絡社交平臺,如微博、微信及新聞客戶端等數據信息進行統計、分析,能夠克服傳統的靜態的、單一的輿情監測,實現監控的動態性、全面化,從而掌握最為真實的涉腐網絡輿情并對其及時回應,以實現司法機關與社會公眾的良性互動。其三,高效、便捷、安全。大數據反腐模式下,腐敗人員的行為記錄、生活軌跡等信息都會形成不可磨滅的痕跡,經過分析之后可形成有效的證據。這其中,既包括政府機構自動監測到的行為,也包括公民的網上舉報。就公民的舉報來說,由于大數據反腐自身的隱蔽性、便捷性、高效性等特點,檢舉人不會因實名揭發而遭致被檢舉人的打擊報復,自身安全系數與積極性大為提高。檢舉人只需要一部手機,即可通過舉報網站或公共論壇將信息傳至五湖四海,而且通過網上各種公開透明的網絡平臺查詢反腐進度。其四,增強信息公開性,取得公眾的信任。陽光不僅是最好的防腐劑,而且是順應民心的潤滑劑。大數據反腐模式下的一切信息都是公開的、可查詢的,權力機關在正確行使權力的同時與群眾積極互動,化被動為主動,能夠有效地消除民眾內心疑慮,贏得公眾的認可,避免輿情危機的發生。
大數據技術運用于腐敗犯罪的關鍵在于各部門之間的數據庫支撐,通過各數據庫之間信息的開放、共享,并對獲取的數據進行分析、整合,實現腐敗犯罪的預防。就數據維度層面而言,需要從各種渠道采集與腐敗行為相關的數據。打通數據孤島,是目前大數據反腐面臨的關鍵挑戰。數據分析和算法應用方法,需要結合投標數據、工商數據、稅務數據、銀行及金融數據、公開披露的財務數據等進行綜合分析,而這些數據都存儲在獨立的局域網以及不同類型的獨立數據庫中,因此需要建立高權限的反腐大數據網絡,結合以上各個相關部門及機關子網絡的權限機制,建立訪問各個目標局域網的終極權限體系。⑥我國各級政府在不斷的信息化過程中,取得了一定的成績,陸續有3000 多個數據庫,80%的社會信息數據庫已經為各級政府所掌握,不斷地突破了信息建設孤島、網站建設孤島、系統孤島的困境。但是,仍然有70%的數據庫相互之間并沒有連通,信息孤島仍然是一個客觀存在的事實。具體來說,數據信息之間的連通,既包括工商、稅務、社保、民政以及公安等部門之間的橫向溝通,也包括從中央到地方縱向部門之間信息的有效銜接。雖然《中華人民共和國政府信息公開條例》的頒布標志著我國在信息公開的道路上邁開了關鍵性的一步,但是公開的程度仍然非常低,具體信息的公開范圍、程度等在大數據反腐對數據的需求下亟需明確。另外,回溯腐敗案件治理過程中的巨腐官員,他們一路上踩著邊腐邊升的紅線,由最初的“蒼蠅”發展成“大老虎”,甚至有的從一開始就為自己準備了各種退路。如果實現財物、消費等部門之間的信息共享,及時察覺腐敗的苗頭,便可以做到防微杜漸,起到事半功倍的效果。⑦
大數據可以為分析者、執法者和決策者提供完整多樣的數據報表、數據可視化圖表和預測結果,但是機器學習算法所能預測的結果都是基于目前已知的違法案例而完成學習,最終輸出識別、預測和推薦結果。對于歷史中未被發現且數據分布模式與已知案例有較大差異的案例,機器學習算法并未進行學習,因此無法預測和識別該類案件。一旦數據樣本采集或分析、挖掘等環節存在數據失真,都可能造成結果偏差。與傳統模式相比,大數據技術反腐通過分析、整合大量的數據,挖掘出腐敗犯罪的生成規律,相對來說更具有客觀性。凡事都有兩面性,雖然大數據反腐模式能通過挖掘以往信息的規律進而達到預測將來腐敗犯罪的目的,但是其很可能會造成不可避免的風險。首先,其對特定人群的監控與偏見很可能因其無法實現預測的精確性與缺少因果關系的判斷而使得某些人被潛移默化地標簽化。其次,大數據技術注重通過對已有信息予以分析,并根據數據之間的相關性而作出預測,甚至對尚未實施的未來行為予以懲罰;而非行為人實施的具體行為,大大增加了刑事錯案的風險,違反刑事證據法的基本原則——無罪推定。再次,通過大數據技術分析來預防犯罪,其目的在于懲罰未來的罪犯或者試圖對其起到一種威懾的作用。令人懷疑的是,這種單純威懾未來的罪犯而不加以懲罰的模式,極有可能導致行為人因沒有任何犯罪代價而下次真的實施犯罪的惡果。最后,由于數據來源的復雜性與多樣性,以及系統自身存在的基準謬誤,很容易出現細節的錯誤。但是,這種錯誤所造成的損失卻是巨大的,如某個系統存在0.1%的誤報率和0.1%的漏報率,那么在檢查了萬億條信息的情況下,系統就會產生10 億的誤報。腐敗犯罪發現成功率的提升,愈加強化了人們對系統的信賴心理,導致人們即使面對錯誤時也沒有勇氣去否定。值得注意的是,大數據的本質在于大而非全,因數據的不平等收集或個體被忽略等特殊因素的存在,類似“黑天鵝事件”不可避免,數據的全面性有待質疑,故而導致刑事錯案的風險不可避免。
大數據技術作為客觀記錄人們行為的手段,受其影響最為深刻的莫過于訴訟法中證據的收集、范圍以及適用規則。一方面,大數據背景下,人類在現實世界的活動得到了前所未有的記錄,這種不受時空限制的信息儲存為電子證據的收集提供了極為豐富的數據資源。⑧然而,豐富的數據資源并不等于證據,只能說證據來源于數據資源。因為數據信息的獲取、處置、管理等流程的難度與復雜性的存在,無不提示我們應當從宏觀上考察事物的相關性而非微觀上絕對的真實性與精確性,在海量的電子數據面前,試圖獲取與訴訟相關聯的證據猶如“大海撈針”。這種注重宏觀的相關性、規律性,忽略微觀的精確性、真實性的理念一定程度上動搖了證據的客觀性。另一方面,盡管我國三大訴訟法以及相關司法解釋均將電子數據規定為證據類型之一,但是在大數據時代下,電子證據的脆弱性與穩定性并存,脆弱性表現在易于串改和偽造,證據偏在的問題更加凸顯,證據的真實性難以確認;穩定性表現在即使篡改和偽造也難以完全消除。⑨因此,由于人為的因素導致證據異變的原因將大為減少,而數據與數據之間補強的可能性大為增加。這些電子證據的發展變化都需要細化法律規則,進一步完善電子證據體系。
大數據技術為腐敗犯罪的治理提供新的思維與視角時,也不可避免地侵犯了個人的信息安全。首先,在大數據反腐的過程中,大數據管理技術仍然不夠成熟,一些涉及公職人員的教育、晉升、家庭、財產等情況經過人肉搜索極易曝光,從而導致公職人員的個人隱私甚至與其相交往的親屬、朋友等人的信息無限制地遭到泄露。這會牽涉到一系列對個人名譽的侵犯,甚至導致敲詐勒索等犯罪的發生。其次,通過對網上各種舉報平臺、政府信息公開、網民的舉報線索予以整合分析,舉報人的個人信息遭致公開,其人身安全性面臨著被打擊報復的風險。如果因個人信息泄露而導致其人身安全得不到有效保障,那么猶如向公民的積極性潑了一盆冷水,澆滅的是全民參與反腐的熱情。而且,隨著個人信息的不斷擴展,侵犯的樣態不再局限于個人信息,而是逐漸出現侵犯樣態的群體化及被害人的全民化現象。⑩最后,關于公民個人隱私的法律保護滯后且不健全。目前,我國的憲法、民法、刑法、訴訟法等相關法律對公民的個人隱私保護作了相關規定,但是可操作性較弱,尚不足以適應目前對公民個人隱私保護的需要。大數據時代下,個人信息保護中蘊含的人格利益、信息自由流通權益與經濟利益、公共安全等公共利益之間形成了巨大的張力,這種矛盾和利益沖突將被進一步激化。?因此,問題的關鍵在于如何能夠在確保個人信息安全的前提下,將大數據技術合法、合理地運用到腐敗治理的過程中。
大數據管理技術掌握的嫻熟程度決定了大數據反腐模式運行的好壞。大數據管理技術集數據的獲取、存儲、挖掘、分析等為一體,是一個動態的、持續的過程,整個大數據反腐模式的良好運行離不開每一個過程的成熟和完善。首先,就數據的收集、存儲來看,大數據時代下的每個人的一舉一動都會留下蛛絲馬跡,受到大數據“第三只眼”的注視,因此,各種數據信息呈爆炸式的增長。而由于大數據本身價值密度較低,龐雜的信息總量中必然充斥著諸多不相關的信息,這些信息真偽難辨,為國家機關在最短時間內獲取最關鍵的反腐情報造成了極大的阻礙。另外,這種批量式的、類型化的收集容易使得收集喪失個性化,以致缺乏全面性,從而形成反腐盲區。其次,大數據分析技術是數據管理過程的關鍵。數據分析的過程中,網絡反腐輿情監測系統以及其他監測設備每時每刻都會收到成千上萬的數據信息,大數據技術以對事物之間的相關性分析為核心,這可能導致從雜亂無章的數據中得出很多事物之間存在相關的結論,但卻并沒有真正的價值,而且任何一個細節分析的錯誤必然導致錯誤率的成倍增長。最后,正如富蘭克斯所言:“成功分析的關鍵不是工具和技術本身,使用這些工具和技術的人才是取得成功的核心要素?!?大數據的發展需要一大批懂技術、懂管理、懂統計的復合型人才的推動,如大數據分析師、數據開發工程師等。故而,大數據在腐敗治理過程中最終是否會產生良好效果以及產生多大效應,關鍵在于是否擁有掌握過硬技術的大數據人才。
大數據技術用于腐敗治理的關鍵是通過分析數據資源之間千絲萬縷的關系,發現犯罪的規律,從而實現腐敗犯罪預防的目的。因此,數據的價值在于相互之間的整合而非檔案室中的陳列。正如上文所述,各個部門之間的信息仍然處于相互隔絕狀態,一定程度上影響了大數據技術的發揮。要打破這種信息孤島現象,實現互聯互通?;ヂ摶ネㄓ欣诖龠M協同高效的數字法治政府建設,有利于建立開放的平臺生態系統而促進平臺經濟高質量發展。?故此,建立跨地區、跨部門、跨領域的信息數據庫,既包括從中央到地方的縱向信息分享,也包括司法、行政、工商、農醫等各個橫向部門之間的溝通,將公職人員的相關行為置于數據信息的監控之下,一旦發現異常情況便可以予以及時阻止,避免諸如“房叔”“房嬸”等“大老虎”的產生。2023年3 月,中共中央、國務院印發了《黨和國家機構改革方案》,其中涉及組建國家數據局的內容。國家數據局的組建有利于我國數據基礎制度的建設,有利于數據資源的整合共享和開發利用,更有利于國家重要信息資源的開發利用與共享及信息資源跨行業跨部門的互聯互通。應充分發揮國家數據局職能,構建反腐倡廉數據庫,使其在大數據反腐上凸顯優勢。通過登錄數據庫,公職人員的信息經過財政、紀檢等部門的“診斷”,可以明顯發現其是否存在賄賂犯罪以及違反紀律方面的“病史”,即使是很小的問題,通過對其予以比對分析也會留下“病歷”記錄。如此一來,不僅能夠防止病情由小變大、由單個病變成傳染病,而且能夠根據病歷上的病因進行有針對性的治療,從而對癥下藥。
任何事物都有風險,大數據技術也不例外。我們應當盡可能地提高大數據技術分析的精確性,從而避免大數據技術在腐敗治理模式中造成刑事錯案的風險及違反無罪推定原則。具體來說,首先,采取定性與定量結合的統計方法,設定具體的閾值實現對風險的控制。大數據技術運用定量的方法,通過對海量的信息予以挖掘,從而對腐敗犯罪予以預測,但是可能導致與實際的偏離。通過對現象的歸納總結,找出事物本質的定性研究方法則能夠彌補定量分析方法的缺陷,而定性分析過程中的不確定性與主觀性一定程度上又可以由定量分析方法對其進行互補。在腐敗犯罪防控的決策過程中,應當同時對犯罪嫌疑可能性風險與具體刑事強制措施的風險性進行評估。例如,根據大數據技術分析的結論,對王某定罪的可能性為2%,那么根據合理懷疑原則就不能對其實施刑事強制措施;如果對其定罪的風險高達50%,便可以對其采取刑事強制措施。具體閾值的設定應當參考犯罪的種類、案件的發生率、證據的充分性等多種因素予以衡量。?其次,對于大數據反腐得出的結論應保持審慎的態度。大數據通常注重具有相關關系的數據信息,如此便會忽略因果關系的、非數字化信息的判斷。而腐敗犯罪是一種極為復雜的社會現象,具體的每個公職人員的主觀心理與客觀情形存在差異,因此,我們應當結合具體的情形綜合考察其結論的真實性與準確性。再次,依靠但不依賴大數據,注重情報收集的人工化。一方面,要樹立大數據技術的思維、理念,從而判斷出行為的大致走向;另一方面,設置人工收集情報渠道(熱線電話、微博、微信等)并對結論予以分析,以避免錯誤的發生。最后,大數據技術能夠預測具體的某個人在某個時空內實施犯罪的風險,但在決定是否采取刑事強制措施時,則依賴于對精確度的具體把握。應當以具體的標準為依據,保證信息和數據的真實性與安全性,排除不相干的數據以防止影響精確度。
大數據技術反腐模式的確立,在一定程度上影響了電子證據的適用規則。針對上述證據規則適用的困境,可以從三個方面著手。首先,應當引導樹立正確的證據法基本理念。大數據技術通過分析涉腐人員過去的行為預測未來的行為,這種邏輯下的分析模式隨著預測的精確度越來越高,極有可能導致推理型的偏見,從而在行為人的行為或結果發生之前采取措施,違背意志自由原則,否定了人們未來改變的可能性,容易走向英美法系品性證據的極端。我們應當始終堅持理性原則與意志自由的不可侵犯性,堅持行為人只能對自己的行為負責。其次,在大數據時代下,記憶是常態,被遺忘是例外。但是,在存儲容量巨大的電子系統中,可能會因為新舊技術系統的更新換代,或者涉腐當事人最初就為自己準備好退路,通過刪除、毀損的方法造成證據缺失,從而使得案件處于真偽不明的狀態。對于此種證據偏在的情況,應認為電子證據與傳統的書證二者中包含的信息對于案件所起的作用是相同的。因此,可以借鑒法國、德國的規定,仿照書證,規定電子證據的當事人在一定范圍內有強制其提交證據的義務。可以引入電子證明妨礙制度,針對以妨礙對方使用為目的,在訴訟前或訴訟中故意采取將案件的相關電子證據滅失、隱匿或其他行為,則可以將其視為證明障礙,對其予以行政罰款并認可對方就該文書的主張事實為真實。最后,大數據技術改變之前探求事物之間因果關系的認定,尋求事物之間的相關性,并認為這種分析邏輯更為有效。但是,我們認為相關關系只是為因果關系的分析奠定了基礎,因為在大多數情況下,一旦完成了對大數據中的電子證據的相關關系分析,即知道了“是什么”后并不會止步于此,而是會找出背后的“為什么”,即電子證據之間的因果關系。?因此,相關關系的分析并不是電子證據收集的唯一方式,仍然要根據傳統的因果關系進行證據的調查。
大數據技術在為準確地預防腐敗犯罪發揮沖鋒陷陣作用的同時,也像是一把利刃刺向數據最為敏感的核心——數據隱私。因此,尋求克服大數據技術安全風險的對策,保護公民個人的數據隱私,才是未來大數據技術能夠更好地發揮自身價值的應有之義。對涉腐數據中關系到國家安全的信息,應當按照《生成式人工智能服務管理暫行辦法》《中華人民共和國網絡安全法》《中華人民共和國數據安全法》《中華人民共和國個人信息保護法》《中華人民共和國科學技術進步法》等法律法規精神,采取分級的管理方法,以國家安全保護為核心,對其安全級別予以劃分,并對與國家安全有關的信息采取專項化管理,設置查看與使用權限的等級。?
對涉及公民個人的數據隱私保護,應當從技術的提高、法律制度的完善等方面著手。首先,從技術上看,提高技術是數據安全隱私保護的根本之策,如果沒有過硬的技術保護公民的隱私,那么任何數據安全保護策略都是泡影。應當不斷地研發安全管理技術,提高安全管理手段,為數據安全提供最佳屏障。具體應從內外兩個方面予以防范:就內部而言,對國家安全數據、個人隱私數據進行特殊標記,并就訪問用戶予以相應限制;從外部來說,不斷開發安全管理技術,就各種政府信息平臺、舉報平臺、社交論壇平臺上的公民信息及敏感信息如生物識別信息等采取防火墻技術加密處理,以防數據遭到黑客的惡意攻擊。其次,法律是數據安全保護的制度保障。美國預測警務將保護公民隱私作為其執法的前提,其第四修正案及相關公民隱私權法案規定,警方在收集和使用個人隱私數據時,應當遵循公開原則、收集限制原則、目的明確原則、使用限制原則等基本原則。?我國《憲法》《刑事訴訟法》等法律以及相關的司法解釋都有個人信息保護的相關規定,但是較為原則且分散。因此,可以從四個方面予以健全和完善:第一,進一步細化并落實《生成式人工智能服務管理暫行辦法》規定,在促進生成式人工智能健康發展的同時,維護國家安全和社會公共利益,保障網絡安全和數據安全。第二,優化《中華人民共和國個人信息保護法》與刑事法的銜接,完善數據的采集、處理、利用以及司法救濟與違法責任相關規定;進一步細化關于公民尤其是國家工作人員相關的財物數據、身份數據和消費數據等具體使用規則,以實現信息的充分保護與有效利用之間的均衡。第三,修訂現行《中華人民共和國刑事訴訟法》,明確規定在腐敗案件的偵查中,如果牽涉民眾隱私信息則應當事先獲得司法機關令狀許可,否則其獲取的證據不具備可采性。對于網絡非法取證行為,確立網絡證據非法排除規則;對于侵犯個人信息的行為,《中華人民共和國刑法》應當設置相應的刑事責任配套機制。?第四,根據心理學家斯坦利·米爾格萊姆的“六度分隔理論”,任何兩個陌生人之間,最多只需要通過6 個人便可完成兩人之間的聯系。那么,在互聯網時代背景下,人們通過對若干支線的數據點予以分析,就能夠調取任何個人信息。因此,應當嚴格限制大數據分析的數據庫連接,而且只能基于直接證據的數據相關性作為數據庫連接的標準,禁止對間接證據所引發的相關性的數據予以挖掘。
世界上諸多國家都將大數據技術水平的高低視作未來衡量國家綜合競爭力的一項重要標準,并將其提升到戰略性的高度。大數據技術的有效應用關系著大數據反腐模式的良好運行,如果沒有大數據技術,大數據反腐也就成了無木之本、無源之水。因此,國家應當加大財政投入,不斷擴大基礎網絡設施建設,將腐敗治理等其他社會事務納入大數據的監控之下,建立“政府事務云”,不斷創新與應用諸如印度的“我行賄了”的分析方法與數據軟件,提升政府的數據分析能力。同時,針對上述信息技術管理過程中存在的問題,一方面要將傳統的因果關系判斷與相關性關系的判斷相結合,由“是什么”進一步延伸到“為什么”;另一方面,要注重發揮人工在數據的收集、分析過程中的作用,以彌補系統自身存在的局限性。?此外,大數據技術作為一門新興的技術、一種“硬”的技術,還是要依靠于“軟”人才的掌握,實行“軟硬兼施”。應當引進與培訓大數據技術人才,建立人才數據庫,培養適應現代大數據技術形勢的人才隊伍,加強培訓力度,增強其信息分析能力與數據處理能力,從而為大數據反腐提供有力的智力支撐。大數據反腐的基礎是數據,只有來源廣泛且質量可靠的數據才能為高效反腐提供強有力的支撐。因此,對于不適宜由政府承辦的業務或者更適合由其他機構承辦的事項,應當積極地與技術先進的企業進行合作,從而提高大數據反腐的質量與效率。
傳統的反腐敗研究多將精力集中在宏觀的制度層面,希冀通過制度改革驅動腐敗治理現代化。大數據技術的出現使一種新型腐敗犯罪治理模式成為可能,腐敗治理的模式正在向動態監督方向發展。大數據的情報研判、風險預警、可視化信息分析等技術為我國科學地作出腐敗犯罪防控決策插上了翅膀。但是在大數據技術反腐敗模式推進的過程中,也存在關聯數據共享程度偏低、數據偏差可能誘發刑事錯案、證據規制適用困難、個人信息安全受到威脅、數據管理水平不高等困境。對大數據技術反腐這一新鮮事物,如何能夠擴大其適用范圍,盡可能地發揮其價值,并規避隨之而來的風險,才是未來課題研究的重點。