豐 葉
(中南財經政法大學法學院,武漢430000)
隨著計算機和網絡技術的普及,大數據作為一種分析手段、研究方法,逐漸在社會、經濟、政治、文化、法律等各個領域蔓延開來。云計算、物聯網、移動網絡、云存儲、人工智能這些耳熟能詳的詞匯充斥著社會生活的方方面面,小到個人購物,大到政府決策,都受到大數據分析的深刻影響。司法實踐中,人工智能辦案系統①206刑事辦案輔助系統作為一款橫空出世的推進以審判為中心的辦案改革軟件,在對上海幾萬份刑事案件的卷宗、文書數據進行學習后,以大數據、云計算和人工智能為技術內核,獲得了初步抓取、校驗和分析證據信息的能力,并于2019年首次以輔助工具的身份進入庭審,利用語音識別將庭審信息高效準確地轉化為庭審筆錄,智能審查證據,基本實現了從立案、偵查、報捕、起訴、審判均在“206系統”內運行。中國法院網:https://www.chinacourt.org/article/detail/2019/01/id/3713361.shtml 2019年11月1日最后訪問。、大數據偵查方式也在如火如荼的展開。大數據以其 4V(Volume、Variety、Velocity、Value)特點,通過對海量數據進行篩選、過濾、分析,使用算法形成結論。由于加入了電腦邏輯,大數據分析呈現出超越人腦的新樣態,使人類的認識決策邁上了新臺階。習近平總書記指出“數據是新的石油,是本世紀最珍貴的財產……”。2015年,國務院發布《促進大數據發展行動綱要》中提出“推動政府治理精準化,完善大數據監督和技術反腐體系,促進政府簡政放權、依法行政。”2017年,最高檢印發《檢察大數據行動指南》中部署了依托大數據及智能語音等前沿科技,打造“智慧檢務”的任務。如何探索把統一適用的證據標準嵌入數據化的辦案程序中,實現“用數據說話、用數據決策、用數據管理、用數據創新”是司法實踐面臨的全新挑戰。大數據究竟為何?大多數學者認為目前對“大數據”一詞還沒有有效的定義,美國學者Ju?lie Cohen提出:“大數據”是技術與過程結合的簡稱,該技術是一種信息處理硬件的配置,能夠在很短的時間內篩選、排序和查詢大量數據,這個過程包括從數據中挖掘“模式”,將模式提煉為預測分析,并將分析應用于新數據。”[1]其他學者和專家解釋說,大數據是一個廣義的、不精確的術語,指的是在數據科學和預測分析中使用大數據集。”
大數據究竟是一種研究方法還是一種分析工具,大數據分析在偵查/調查、審查起訴、審判中能否作為證據使用,如何作為證據使用,其證據屬性為何,在理論界莫衷一是。贊成者認為,大數據分析因其具有科學性、精準性、高效性,理應作為定罪量刑的依據。由此形成了幾種觀點:(1)“獨立的證據種類說”。該說認為大數據分析報告應當作為獨立的證據種類單列出來,它是一種不同于電子證據的新的證據形式,是將有關犯罪嫌疑人、犯罪行為的原始數據進行二次挖掘后,在對海量數據進行過濾、分析的基礎上,形成的反映案件深層次特征的新的分析數據,這些分析數據改變了原始數據的形態,是人工智能的一種體現[2];(2)“鑒定意見說”。該說認為如果以大數據分析報告作為證據,就應當將其納入法定證據種類之中,它不是原始數據,是經過加工、分析、甄別、判斷、匯總而形成的新數據,所以在現階段應當將其歸類為“鑒定意見”,盡管其與現行法律中所規定的鑒定意見尚有差異,但就其專業性、科學性而言,賦予其“鑒定意見”的地位不失為權宜之計[3];(3)“電子數據”說。該說認為大數據證據是基于機器算法產生的一系列分析數據,最終以電子數據形式呈現,它的收集、調取、運用方式(凍結)也與電子數據一致,這是它的本質[4]。反對者則認為,大數據分析報告使用平均數據形成決策指引,而不考慮極端情況和潛在的異質性,它的本質是文本的,但它無法解釋自己,而且機器算法缺乏透明度和問責制,所以其風險遠大于價值,難以作為證據使用[5]。對于上述爭論,筆者持贊成觀點,大數據分析報告不僅應當作為證據使用,還應當單列出來作為獨立的新型證據種類也即大數據證據。這是因為,其一,大數據分析由于加入了人工智能的分析結論,已經遠遠超越了電子證據僅借助電子載體承載的靜態證據形式,這種分析既具有總結性、智能性,又具有預測性、易變性,與電子證據是不可同日而語的;其二,就鑒定意見的證據屬性來看,它是由專業人士就案件專業問題給出的專門意見,鑒定意見是由“人”作出的,大數據分析是由“機器”產生的,鑒定意見的作出具有程序性、可評估性,這就必然導致二者的性質、適用程序、證據規則大相徑庭。所以,只有肯定大數據證據的證據地位,才能從法律角度對其予以針對性、專門性地規制。
“互聯網+”時代下,職務犯罪呈現出犯罪行為多樣化、犯罪形式隱蔽化、犯罪手段智能化的特征,傳統的口供中心主義受到諸多非議。隨著職務犯罪案件監察調查的轉型,各地監察機關利用大數據優勢,通過大數據比對監督、精準畫像,開啟了制度化、信息化、公開化的監察調查路徑[6]。大數據分析手段已經成為監察全覆蓋的重要支撐和科技反腐的必由之路。大數據分析報告如何在監察調查程序、審查起訴程序、審判程序中作為證據使用,如何防范大數據證據的適用風險,都給傳統證據理論造成不小的沖擊。
我國《刑事訴訟法》采取列舉式證據,將其分為8類,大數據分析因其特殊性,難以歸入任何一個證據類項下,但不能因此否定它獨立的證據地位。社會“數據化”的結果是越來越多的信息以數字化的形式呈現[7],這是不容逃避的現實,是否能從科學的視角審視大數據證據,突破傳統的證據觀,賦予其合理的證據地位決定著大數據分析未來的發展方向和刑事訴訟證據理論的進步。筆者認為,用傳統的證據理論難以解釋這種新興科技產物給證據理論帶來的沖擊,只有借助循證法治決策理論、個人化的概率評估理論、結構主義理論才能跳出“個人主義”的藩籬,為大數據分析在刑事證據家族中找到一席之地,實現理論邏輯與實踐邏輯的統一。
隨著循證醫學②循證醫學的核心思想是醫療決策必須以客觀的研究結果為依據,既強調臨床經驗又強調科學研究的依據。的發展,循證方法逐漸進入社會科學的研究視野,學者們隨即提出了“法循證學”。基于法循證學產生的法循證方法是在結合信息技術的基礎上,強調法學研究必須以客觀結果為依據,這為法學領域高質量決策提供橋梁。“法循證學”認為,證據的價值在于為司法裁判提供合法性依據。由此產生刑事訴訟領域的“循證法治決策”理論是指,證據經歷了從感性證據(例如,神明裁判)到理性證據(在法律中規定證據種類,例如,書證、物證等)的發展過程,對犯罪案件法律真實的認定也經歷了從司法決策(通過法律創造理性證據規則,遵循法定程序尋求法律真實)到法治決策(依據法律規定的理性證據以外的其他證據判斷法律真實[8],通過挖掘新的資源,激活多元化、客觀化、系統化的證據決策因素,實現證據決策最優化)的進步。因此,大數據背景下的法治決策不再是理性證據基礎上所決定的司法決策[9],即使是司法決策也是在綜合感性、理性、客觀、主觀、人情、天理等證據基礎上(而非僅僅是法律文本上所載的證據種類)作出的綜合全面的法治決策。大數據采取關聯性分析的方法,將人口、車輛、話單、資產、電子數據、歷史案件信息、身份信息等進行匯總,從而發現犯罪線索和證據,抓捕犯罪嫌疑人[10]。這正是法治決策的表現形式,大數據證據通過將海量數據(事實)收集加工,形成分析報告,經過法定程序進行評價和選擇,挑選出了個案證據,最終又將個案證據用于形成新的社會認識[11]。這種新的決策機制在司法活動中逐漸蔓延開來,因此,承認大數據證據的正當性和地位,是“循證法治決策理論”對尋求法律真實方法的更具合理性、科學性的要求。
個人化的概率評估是貝葉斯創立的利用事件的先驗概率和新的證據得出新概率的方法。如果裁判的準確性是指事實認定與經驗真理的符合性,那么這種符合性從來都是不確定的但卻是可能的[12]。在犯罪案件偵查/調查、審查起訴、審判過程中,會不斷地出現新證據來修正“犯罪事實如何發生、由何人所為”等事件的概率。根據貝葉斯定理,在個人化的概率評估中,事件發生的比率與決策者(犯罪人)的決策相關,決策者的信念程度應當具備內在一致性,這樣的信念可能建立在相關事件發生的頻率上。貝葉斯定理的主要作用就在于不斷運用新證據、新信息修正對事實的認定。例如,在職務犯罪案件中,如果已知A1(補償款未發放到位)的條件下假設事件T(張某犯貪污罪)的概率,當決策者獲得了T的先驗概率P(T)以及偶然出現的A1的概率P(A1),A1就是事件T發生的條件概率③P(T)是貪污罪T的先驗概率,是事件A1(補償款未發放到位)的預判概率,P(A1)是事件A1的先驗概率,是事件T的預判概率,P(T/A1)是事件T(貪污罪)的后驗概率,這一概率可以作為新信息的先驗概率,其他的新信息會不斷修正事件T的概率。,P(T/A1)就可表示為貪污罪T發生的后驗概率,P(T/A1)=P(T)?P(A1/T)。當不斷有新的信息A2(村民甲未收到補償款的證言)、A3(張某的銀行賬戶有來源不明的收入)……An導入時,事件T的概率會不斷被修正(提高或降低),可以將這一概率再用作先驗概率繼續評估證據或信息,就會得出一個結論:證據總是不完整的,出現任何一個新的事件都可能修正這些概率。由于大數據證據所涉信息量巨大,這就擴大了相關證據的收集范圍,為事件的認識源源不斷地提供新信息,這些統計數據進入司法證明領域,增加案件事實的信息源,修正經驗性證據對事實的信念,增加概率評估韌性,提高證據的可信度,從而影響裁判結果,使之無限接近案件事實,這是貝葉斯定理的新發展[13]。
結構主義理論最初由奧地利哲學家路德維希?維特根斯坦提出,他認為世界由許多狀態組成,每一種狀態都是由多種事物組成的鎖鏈,這些鎖鏈都處于特定的關系中,它們互相影響并產生作用,這種關系就是這個狀態的“結構”。結構主義的核心觀點即“整體優于部分”。證據學中的“結構主義”則表現為“證據鏈”。“證據鏈”是指,證據證明的對象是案件事實(法律真實),刑事證明的對象分為待證事實與證據性事實。待證事實與證據性事實之間的關系被稱之為“相關性”,證據性事實能否推導出待證事實是存在疑問的,因此就需要不只一個證據性事實發揮作用,多個證據性事實形成的即為證據鏈[14]。大多數學者認為,證據發揮效能的原因在于證據與事實之間的因果關系,但在司法實踐中,單線性的因果關系是難以呈現的,這種因果關系并不能周延。相反,基于證據鏈形成拓撲結構圖的分析方式稱為結構主義,可以以這種證據鏈結構主義彌補因果關系的缺陷,實現證據鏈向縱深推進[15]。從刑事證明理論來看,孤證不能定案,所有的證據都具有偶然性。大數據證據提供的是可能性證據,在大數據證據的內部,需要對千千萬萬數據進行排列組合、篩選、過濾、評價、分析,這千千萬萬的數據形成大數據證據內部的“子結構”并通過不斷出現的新數據修正“子結構”的形態。申言之,大數據證據“子結構”中的各個數據并不是基于因果關系組合在一起,這是大數據證據自身的“結構”。在大數據證據的外部,則需要有其他相關證據與之形成正向強化關系或負向削弱關系,來判斷大數據證據與其他證據是否具備可采性,是否形成完整的證據鏈[16],達到1+1>2的效果。
此外,我國《刑事訴訟法》采取列舉式證據方式,這種列舉式必然存在不周延的情形。在司法實踐中,交通事故責任認定書、未成年人社會調查報告、品格證據等雖然不是法定證據種類,但也可以作為量刑的依據[17]。值得論及的是,證據與待證事實之間應當存在生成關系,品格證據、社會調查報告因不具備這種關系而不能成為定罪證據,但大數據證據卻符合這種生成關系,這也是其正當性所在。根據我國證據規則所確立的以法定證據種類為橫向坐標,以“材料——證據——定案根據”為縱向審查步驟的基本框架[18],證據的產生、發展、運用是一個動態變化、審查排除、更新遞進的過程。因此,基于腦科學、智能認知手段形成的大數據證據在職務犯罪案件監察調查、審查起訴、審判中與其他證據之間更重要的價值功能或判斷標準在于證據之間互相印證。在此基礎上,充分認識和挖掘大數據證據,肯定其證據地位并將其作為獨立的證據種類是可行的,也是十分必要的。
2018年內蒙古烏海市監察機關辦理的“齊國榮受賄案”運用大數據優勢,成立了四個財產查詢大數據信息組,成功查獲齊海榮的犯罪證據,開啟了內蒙古監察機關運用科技辦理職務犯罪案件的先河。在此基礎上,他們先后與37家單位部門建立查詢專線、數據接口,構建信息查詢中心,匯總整合數據137項,引入信息查詢機器人,實現數據共享。過去由2名偵查人員查詢3天才能完成的信息,現在由機器人不到2小時就能完成④《內蒙古紀檢監察機關大數據系統建設:查證一鍵知曉辦案省時省力》,https://baijiahao.baidu.com/s?id=1630574736421158115&wfr=spider&for=pc,2019年9月7日最后訪問。,實現了從跋山涉水到一鍵獲取的飛躍式進步。
大數據證據的作用機理在于對海量數據進行關聯性分析從而得出結論。關聯性分析的創新之處在于將各種與犯罪嫌疑人有關的數據匯總在一起,利用統計原理、集合原理、關系圈原理,對各種數據進行交叉關聯分析,區別于傳統偵查模式下,大量分散的證據碎片難以發現并整合為一體,單獨分析得出的不確定、片面的結論,關聯性分析大大提高了工作效率,不僅增加了分析的準確性,而且有利于及時發掘與預防犯罪,這是人力所不能及的。在職務犯罪監察調查中,所涉數據種類繁多,包括:公安數據、檢察院數據、通信數據、工商數據、稅務數據、房產數據、民政數據、住宿數據、民航數據、銀行賬單數據等[19]。而職務犯罪數據資源整合系統,通過數據采集、數據處理、數據存儲、數據決策分析對結構化數據、半結構化數據、非結構化數據進行提煉整合[20],一方面利用網絡爬蟲技術,自動抓取行政機關的組織構架、人事變動等信息;另一方面,與相關政府職能部門協作,暢通數據信息收集渠道,開通專項數據接口⑤中央紀委國家監委網站:《大數據給職務犯罪調查帶來哪些變化?——訪中國人民公安大學陳剛教授》,http://www.ccdi.gov.cn/toutiao/201902/t20190212_188423.html,2019年9月10日最后訪問。。例如,浙江省金華市建設的“大數據廉政信息分析”系統,搭建起涵蓋全市行政人員的人事、權力等信息,通過房產、車輛、行政審批等信息查詢對行政人員進行監督,實現“以事找人”、“以人找事”⑥中央紀委國家監委網站:《運用大數據,提高精準監督能力》,http://www.ccdi.gov.cn/yaowen/201806/t20180624_174369.html,2019年9月10日最后訪問。。
刑事證明有“七何要素”:何事、何時、何地、何情、何故、何物、何人”,這是證明犯罪事實的基礎[21],職務犯罪證據既包括證明犯罪嫌疑人自然情況的證據,例如姓名、國籍、年齡、精神狀況、婚姻狀況等,又包括對其身份和履職情況的證明,還包括犯罪動機、犯罪行為等犯罪構成各個方面的證據。然而,并不是所有的證據都需要通過大數據分析的形式獲取,只有隱蔽性強、關聯程度高并且已經數據化的信息才望成為大數據證據。在職務犯罪案件中,由于大數據所涉信息量巨大、類型多樣,如何選取信息,選取何種信息,為什么選取這種信息,信息源頭的差異化處理,都會影響大數據證據的形成。
我國《刑事訴訟法》將證據分為8類,但在不同的犯罪案件中證據分布各具特點,同一罪名下的證據分布具有規律性,這就是“類罪證據分布理論”[22]。提出該理論的學者將刑事判決中定案的證據作為類罪證據分布的“映射”進行研究,從大量判決中得出部分罪名證據分布的不同特點。例如,盜竊罪的證據以證人證言、被害人陳述、被告人供述與辯解、鑒定意見為主,其中被告人供述與辯解約占90%,被害人陳述、鑒定意見約占60%,其余證據約占20%。受賄罪以言詞證據為主,證人證言約占95%,被告人供述與辯解約占95%,書證約占60%,物證、鑒定意見、視聽資料、電子數據分別約占10%[23]。筆者認為,從刑事判決中得出的類罪證據分布數據具有一定的合理性,刑事判決中的定案依據在一定程度上反映了某類案件的主要證據類型,因此,將“類罪分布理論”應用于職務犯罪大數據分析,指引大數據證據的捕獲方向具有重要意義。但作為判決形成依據的證據經過庭審的舉證、質證、認證過程,是鑒別、篩選之后形成的,不能完全體現審前階段的證據特點。如果將大數據證據運用于職務犯罪調查、審查起訴、審判的全過程,就不能僅僅局限于裁判文書中所載的靜態定案證據,還應當全面分析影響職務犯罪證據形成的因素,關注證據動態收集、舉證、質證、認證的全過程,從而得出職務犯罪證據的分布方向,為大數據信息采集提供指南。值得論及的是,該學者通過類罪證據分布理論得出的結論是,受賄罪主要以言詞證據為主,這說明傳統證據理念仍然占領高地,落后的司法意識與先進的科學技術互為掣肘,而大數據證據的正確適用剛好可以緩解“口供中心主義”帶來的調查障礙,助推人權保障邁上新臺階。
由于職務犯罪行為結構具有穩定性,這體現在:犯罪主體可控性(國家機關公職人員)、表現形式相似性(利用公職行為進行權錢交易損害國家利益)、行為模式固定性(行為跨度時間長、建立穩定單一的利益輸送關系),具有共同的犯罪特點[24]。因此,筆者認為職務犯罪中的“類罪證據”收集分析應當從職務犯罪的犯罪構成著手,以職務犯罪行為為關節點展開,關注犯罪實施的動態過程,獲取與犯罪行為緊密相關的證據。
筆者通過對中國裁判文書網公布2018年全年審結的貪污賄賂案件(貪污罪判決書1 774份、受賄罪判決書2 310份)中的部分裁判文書進行分析得出,以貪污罪為例,貪污罪存在取證難、查證難,可獲取的證據類型少、贓款認定追繳難度大、證據環節多等問題[25]。貪污罪時常伴隨受賄罪、濫用職權罪、挪用公款罪等一起發生。在裁判文書中體現出:貪污罪的犯罪嫌疑人通常采取侵吞單位資產、捐款、房租、會議費,收入不記賬,侵吞拆遷補償款、征地補償款、政府撥發的資金,隱匿國有資產,騙取、竊取企業改制費、土地出讓金、稅費,虛增款項據為己有,虛開發票等方式將國有財產據為己有。這些行為通常表現為利用職務便利或利用其他公職人員的行為,可以大致分為幾類:第一,利用職務便利,侵吞國家特定資金、財物;第二,利用職務便利,以虛開發票、虛列合同、虛增款項等方式騙取資金;第三,利用職務便利,竊取國有資產。以受賄罪為例,受賄罪的犯罪嫌疑人利用職務便利為他人在簽訂合同、招標投標、承攬業務、工作調動、人事升遷、子女入學、征地拆遷、項目推進、土地使用、土地轉讓、資金撥付、設備采購、開設賭場等方面提供幫助,從而通過收受實物、禮金、購物卡、入股、以明顯低價購買商品等方式獲取利益。盡管裁判文書中所呈現的內容具有一定的局限性,但足以說明職務犯罪案件中“利用職務便利”是實施犯罪行為的關鍵。
“利用職務便利”是職務犯罪的必要行為方式,無論是貪污罪、受賄罪、挪用公款罪還是濫用職權罪,都圍繞職務行為進行。并且有學者指出,職務犯罪證據具有“層級性”特點,這表現在:犯罪行為通常隱藏在內部會議紀要、政策文件、規劃方案、審批事項的檔案中,呈現出層級系統的“職場”與權錢交易人員“交易現場”分離的狀態,“權”與“利”的交易環節“模糊不清”甚至“阻隔”的情況,導致調查取證難[26]。因此,大數據證據的收集方向應當著眼于公職人員的職務行為,以此為基點散射展開,根據不同的職務、職務所涉范圍,具體分析履職行為過程中涉及的人、財、物、事、時、空,推及到由此形成的“親緣、地緣、友緣、情緣、業緣”[27]關系圈、數據鏈,有目標有范圍有針對性地進行數據篩選、分析,形成定罪量刑的證據,轉變將分析重點集中在被調查人的交易信息、銀行賬戶信息、出入境信息、購房購車信息等內容上的調查思路,這類信息本身也屬于個人隱私,只有在正式立案后才能采取調查手段獲取。而通過大數據監察系統對公職人員履職行為的監督本身就是監察機關的職責,對這類信息可以適時監控、精準把關,也是及時發現犯罪跡象防止失去調查先機的重要環節。

圖示以“職務行為”為基點散射展開
由于職務犯罪案件的犯罪手段具有詭秘化、隱蔽性特征,獲取證據十分困難。但職務犯罪嫌疑人具有特殊主體身份,犯罪行為往往牽涉廣,所以實施犯罪后,往往與其他犯罪嫌疑人、利害關系人隱藏、轉移、銷毀贓物,制造“迷魂陣”,擾亂調查人員的調查思路和調查方向,阻礙調查行為向前推進或者進行其他反偵查活動,由此會形成能夠證明“原生證據”存在的事實材料,也即再生證據[28]。再生證據具有逆向性,與大數據相關的再生證據通常表現為對計算機原始數據的篡改、隱匿轉移財產關系數據,銷毀犯罪數據,偽造履職行為相關數據(例如偽造發放補償款、救濟金等)。在監察調查過程中,可以通過再生證據逆向尋求大數據證據。由于“利用職務便利”這一犯罪構成中的行為要素在不同的罪名中具有不同的含義,例如,貪污罪中“利用職務便利”是指利用本人主管、經手、辦理公共財物的便利;受賄罪中“利用職務便利”既包括利用本人主管、經手、辦理職務行為的便利,也包括利用職務上有隸屬關系的其他國家工作人員的職務行為之便。因此,原生證據的輻射范圍也因罪名不同而各具差異,原生證據的范圍影響著再生證據可能存在的范圍。這就要求在監察調查活動開始后,調查人員應當通過大數據信息系統對被調查人實行“實時監控”,根據不同罪名、不同犯罪構成、不同犯罪嫌疑人的具體情況、不同犯罪特點,結合職務犯罪規律、辦案經驗,制定差異化的調查方案對于職務犯罪被調查人因職務行為產生的關系鏈、朋友圈、利益網進行篩查,對于發現隱匿、毀滅、偽造數據信息的行為及時抓取,對于再生證據進行歷史記錄查詢、同類比較、關鍵詞搜索,運用“縱向比較+橫向比較”的方法[29],利用再生證據的依附性,及時、精準地找到再生證據所承載的原生證據,并對原生證據進行補強。
有的學者提出,大數據分析作為證據的關鍵在于對大數據證據真偽的判斷。如前所述,大數據分析結果由機器算法產生[30],算法決策已經成為司法實踐的輔助工具,無論是在發掘數據、偵破案件方面,還是在預防犯罪方面都發揮著不可替代的作用。算法的有效性和公正性同時取決于數據的真實性與算法本身。由于可能產生的算法歧視⑦算法歧視包括:偏見代理的算法歧視、特征選擇的算法歧視、大數據殺熟等。,大數據分析并非都具有客觀性、關聯性[31]。這是因為,職務犯罪監察調查過程中,依賴大數據分析得到的線索和證據,可能會因為調查人員的調查行為、數據選擇、調查策略、優先級甚至遺漏而改變大數據分析的算法,眾多的數據可能造成“垃圾輸入、垃圾輸出”[32]。正如反對論者所主張的,大數據存在病毒式傳播的風險,因為數據本身是主觀的、不完整的。這使大數據的效率、質量、透明度都受到了一定的質疑。同時,大數據證據存在嚴重的證據偏在現象,會導致職務犯罪被調查人完全受制于掌握技術優勢和資源的國家監察機關。在此情形下,大數據證據的獲取可能導致控辯雙方權利失衡,而唯一解決這一結構性缺陷的辦法就是承認人類判斷在決策中的價值和作用[33]。鑒于此,在職務犯罪案件中對大數據分析的機器算法進行法律規制和理論指引是保障大數據證據得以有效運用的前提,這種規則表現在:
第一,線索篩查評估規則。在職務犯罪案件監察調查過程中,根據機器算法形成的大數據證據,一方面應當具備合法性、可驗證性、公平性[34]。另一方面應當符合證據的基本屬性,才能作為定罪量刑的依據。這就要求,監察調查中收集大數據證據應當從源頭把關,堅持“全面收集+重點突破”原則,這期間涉及大數據信息的應當進行分類、比較、鑒別、篩選,防止因為信息量巨大造成取證方向偏差,避免缺乏關聯性的線索進入大數據分析決策的基礎信息中。因此,應當通過法定程序規范大數據證據的形成和收集過程。由于大數據分析所具有的深度和廣度,更容易侵犯被調查人的隱私信息,因此,對于初查階段獲得的大數據犯罪線索,應當報請上一級監察機關審批,由上一級監察機關進行研判審查后決定是否展開收集,并決定“由點及面”進行大數據分析。對于形成分析報告的大數據證據,經過上一級監察機關的批準以云平臺存儲方式進行凍結并寫入保護措施。以此通過大數據線索篩查審批機制層層把關,形成大數據證據并移送審查起訴。
第二,證明責任分擔規則。很多學者認為,算法不是人,我們不能保證算法會產生“合理性分析”[35],所以“人的因素”在算法中至關重要。給算法確定一個標準,與給人的判斷確定一個標準是不同的,但實際上算法的優越性會創造更高的合理性[36]。對于算法合理性的評估,則需要由人來作出判斷。在監察調查階段,基于機器算法產生的大數據證據應當告知被調查人,允許其陳述、辯論、申訴[37],對于大數據證據提出異議的應當由監察機關承擔相應的證明責任;在審查起訴階段,職務犯罪嫌疑人、辯護人、近親屬對大數據證據提出異議,可能影響定罪量刑的,檢察機關可以要求監察調查人員對大數據證據的收集情況作出說明或提供相關證明;在審判階段,前述人員對大數據證據提出異議,可能影響定罪量刑的,應當要求監察人員出庭說明情況,必要時應當允許專家證人、專家輔助人到場參與大數據證據的舉證質證過程。對于犯罪嫌疑人、被告人、辯護人、近親屬提出調查人員以非法手段獲取大數據證據的(故意篡改大數據信息、改變優先級等),檢察機關、審判機關應當及時進行審查并要求監察調查人員作出合理解釋或進行補正,對不能作出合理解釋或補正的應當予以排除。
如何評估大數據分析的科學有效性是法律調查的核心。美國法院在“Daubert”案這個具有里程碑意義的案件中決定,初審法官應當對科學證據是否可靠進行初步評估。例如,審判法院必須評估科學專家提供的科學證詞是否是基于科學有效的方法作出的。初審法院必須進一步確定科學推理是否被普遍接受,以及這種科學方法或科學推理能否正確和一貫地適用于所涉事實[37]。Daubert式的法院初步審查模式有助于對這些新興科學證據進行概念化評估和監督,它代表了一種趨勢,說明了法律對待科學的方法:在證據納入審判之前,證據的科學有效性必須達到最低的證據閾值。由此衍生出對科學證據最低證據閾值的確定:1.應當以經過科學檢驗的理論或技術為基礎;2.經同行評審或發表意見;3.雖然有已知或潛在的錯誤率,但這種錯誤可以被認知;4.能被社會公眾普遍接受;5.能被相關科學領域普遍接受。對科學證據可采性的研究并不僅僅限于美國,大多數歐洲國家也在努力尋找這類證據的審查路徑。例如,歐洲有國家規定:法庭對于專家證據、科學證據的說明和論證必須透明;專家可以請求協助;法官可以接受科學技術培訓等等。如果科學界認為某一程序或過程是不可靠的,則依據該程序或過程產生的證據不得在法庭上使用[38]。Daubert式的法院初步審查模式在很大程度上還取決于具體的案例、法院和辦案的法官,它要求法官從相對被動的評估者轉變為積極的探究者,去尋找科學證據的潛在本質。從Daubert案中衍生出的科學證據規則對我國職務犯罪大數據證據的收集、審查、判斷、運用、排除具有一定的借鑒意義。
我國監察機關對職務犯罪案件調查終結移送檢察機關審查起訴的,檢察機關應當對案件進行初步全面審查。這其中既包括對犯罪事實、情節、犯罪嫌疑人身份等違法要件與責任要件的審查,也包括對證據的審查。由此有學者提出“職務犯罪案件司法審查”的概念,所謂對職務犯罪案件的司法審查是指檢察機關、審判機關對于監察機關移送起訴的職務犯罪案件依照《刑法》《監察法》和《刑事訴訟法》的規定進行的專門檢察、審判活動[39]。“司法審查”是一個舶來品,由于我國《憲法》賦予檢察機關作為國家法律監督機關的性質定位,這與西方國家“三權分立”的國家權力結構不可同日而語,所以,對于“中國式司法審查”的這種概念界定是符合我國現代化的刑事訴訟制度的,而對于如何實現對職務犯罪案件的司法審查,尤其是對大數據證據的審查,筆者竊以為,應當由檢察機關通過建立訴訟化審查模式,實現對大數據證據的初步實質化審查,這包括:一方面,設置初步審查多方參與規則。我們可以借鑒美國Daubert式的審查模式,在檢察機關進行初步審查時聘請同行業技術專家到場,輔助檢察機關對大數據證據進行審查,對于監察機關移送的大數據證據應當及時告知犯罪嫌疑人,允許其提出異議,犯罪嫌疑人、辯護人、近親屬對大數據證據的可信度、科學性提出異議的,可能影響定罪量刑的,可以進行訴訟化的審查方式,組織由專家證人、專家輔助人、監察調查人員、犯罪嫌疑人、辯護人、近親屬等共同參與的初步審查程序,對大數據證據的合理性、合法性提出意見。另一方面,完善權利保障規則。使用大數據進行職務犯罪案件調查的,應當將專家輔助人納入法律援助的范圍,在被調查人/犯罪嫌疑人/被告人對大數據證據的準確性提出質疑的,應當允許其申請專家輔助人對大數據證據的真偽進行鑒別。
一直以來,學者們對我國“印證”證明模式提出諸多爭論和質疑,并將其置于與自由心證進行類比的研究框架之中[40]。對印證證明的價值也發出不同的聲音。肯定者認為,印證作為一種證據分析方法,是對證明標準客觀化的追求,具有主體無涉性、技術中立性。印證需要一定的證據量,能夠相互印證的證據應當具有獨立的信息來源。有一定的“廣度”和“厚度”[41]。否定者則提出,印證證明規則是案卷中心主義時期機械化的證據認定標準[42]。在大數據時代下,印證證明與大數據分析是“人類理性主義”與“數據經驗主義”的對立,在大數據碎片化信息的轟炸中,印證證明逐漸式微,自由心證將代替印證證明而存在[43]。中立者則提出,我國的刑事印證證明規則應當被稱之為“新法定證據主義”[44],它將證據的證據能力和證明力用具體的法律規則予以規制,印證證明的作用之一是驗證犯罪案件是否達至法定證明標準[45]。由此有學者表示,我國的印證證明是一種證明方法,區別于“原子主義”與“整體主義”的證明路徑,即使是“原子主義”與“整體主義”也會內含印證的證明邏輯[46]。但印證證明中依據的融貫論主要體現在追求證據內容之間的一致性方面,且它的外延僅限于實質證據,在“一對一”類型的犯罪,例如受賄罪中,實質性證據天然缺失會導致印證證明難以實現。無論是用最佳解釋理論對其進行修正抑或舍棄印證證明采取自由心證的證明方法都不能解決職務犯罪大數據證據的證明問題。
筆者認為,對于不同的證據、證明任務應當設置不同的證明方法和標準。相比之下,自由心證更加注重證據認定的內省性,但對案件事實的認定本身就是主觀見之于客觀的過程,所以印證證明也并非機械地排除自由心證。印證的前提是證據具有共同的指向性,這是認識證據的最低標準,但印證證明并不僅僅是靜態地要求多個證據之間具有同一性,職務犯罪證據的作用在于查明職務犯罪案件的真相。再現案件需要一個過程,不可能一蹴而就,職務犯罪案件在監察立案、調查、審查起訴、審判各個階段需要證明的事項不斷增加、深入、雜糅,尤其是大數據證據,可能一直處于信息源不斷更新、變動的過程中,因此,對于職務犯罪大數據證據應當將其置于“整體主義+原子主義”動態結合印證過程中加以詮釋:大數據證據本身基于海量信息而形成內部印證(單個證據)從而得出分析數據,它的內部互相影響,由多種因素決定其證明力,也即“原子主義”(如前文中貝葉斯的個人化概率評估論),但囿于大數據證據的收集過程缺乏透明度,所以還需通過“整體主義”的外部印證對其能否作為定罪量刑的依據進行檢驗。申言之,直接言詞原則并未在庭審中真正實現,這可能給職務犯罪大數據證據的交叉詢問、舉證質證帶來了一定的現實困境,這就更需要職務犯罪書證、證人證言、犯罪嫌疑人供述、電子數據對大數據證據加以印證,強化職務犯罪大數據證據的融貫性與符合性。
大數據證據的出現改變了傳統的證據模式,出現了人和證據分離的情形,否定了證據的親歷性。受大數據影響,新的時空觀、證據觀逐漸產生。盡管大數據分析助推人類的認識邁上了新臺階,創造出人力所不能及的新成果,但是“人的認識”仍然應當在大數據證據的獲取過程中發揮主導作用。大數據證據的再創性決定了其舉證、質證、認證程序的特殊性,同時也難以避免證據偏在現象造成控辯雙方不平等的現象,這對我國刑事證據規則的發展提供了新的機遇與挑戰。