張 琳
(沈陽師范大學 法學院,遼寧 沈陽 110034)
隨著網絡科技的發展,我們已經進入數據時代。大數據作為數據時代的重要產物,不僅廣泛應用于生活領域、商業領域,而且在司法領域起到了重要的助推作用。移動支付和直播網購成為我國現階段的主要生活方式,這種無現金的購物方式在全世界也是最為先進的。新興的生活模式勢必會形成公民生活離不開網絡數據的輸出這一局面。在司法實踐中,大數據信息為刑事犯罪提供重要的破案線索,例如,基于海量數據提取與現有信息具有聯系性的數據進行比對,從而鎖定犯罪嫌疑人;新冠肺炎疫情防控期間通過行蹤軌跡等大數據查找違法犯罪行為;針對海量資金賬戶信息進行大數據分析等。大數據證據廣泛存在于刑事訴訟中,不僅局限于經濟犯罪和計算機網絡犯罪,多數刑事案件中都存在大數據信息,因為人們的日常生活永遠伴隨著數據的印記。大數據信息作為一種新興的數據模式在各個領域都需要深入研究,在刑事司法領域,它的概念、特征、存在形式等問題是關乎定罪量刑的重要問題。那么,如何界定大數據證據,大數據證據如何具有證據準入資格是刑事庭審中有待明晰的重要議題,筆者擬對大數據證據的內涵及法律地位進行深入的探討,以期為刑事審判工作提供可操作的參考指引,梳理大數據證據與相關證據的聯系與區別。
證據是證據事實和證據載體的有機統一,證據載體就是通常所說的證據表現形式,證據的法定表現形式又稱為“法定證據種類”[1]270。刑事訴訟法第50條列明了八種證據類型,是否意味著我國對于刑事證據類型進行了封閉式限定,即證據材料必須以八種形式之一體現才符合證據形式合法的要求,這個問題值得探討。2021年開始施行的《最高人民法院關于適用〈中華人民共和國刑事訴訟法〉的解釋》第101條新增的一項內容是:有關部門對事故進行調查形成的報告,在刑事訴訟中可以作為證據使用;報告中涉及專門性問題的意見,經法庭查證屬實,且調查程序符合法律、有關規定的,可以作為定案的根據。此處的“可以作為證據使用”是從法律層面拓展了刑事證據的法定形式,在原有的基礎之上增加了“事故調查報告”。此條文可以做以下延伸理解,司法解釋頒布之前“事故調查報告”不可以直接作為證據使用,需要由法官審查之后轉化為法定證據形式方可使用。由此可見,我國在立法層面對于證據形式進行了限定。
我國司法制度和證據制度是學蘇聯的,蘇聯證據法的特點之一,是將證據法定種類一項一項列舉出來,這種列舉式的優點是哪些證據可以在司法中應用非常清楚,證據的法定形式一目了然,但缺點是列舉不周延,需要根據訴訟新情況、新變化隨時作出調整,如果調整不及時,司法活動中對于新出現的證據種類,辦案人員難免產生困惑[2]。隨著社會經濟、網絡科技的發展,新型的犯罪領跑司法,證據規范呈現出滯后的局面。視聽資料和電子數據分別是1996年和2012年刑事訴訟法修改之后新增的證據種類,在此之前,對于兩種證據應該如何界定,是否可以作為證據適用等問題一度成為法學界爭論的焦點。法律規范不可能實時更新,而新型證據隨時都可能出現,如果對刑事證據種類進行僵化式的、封閉式的限定,勢必會使審判活動步履艱難。
筆者認為,我國法律之所以歸納八種證據種類是為了規范庭審認定規則,為法官審查證據提供有差別的指引,因為不同種類的證據審查規則和要點均不同,以證據種類的不同設定不同的審查規則不僅能夠促進證據規則的適用,而且可以限制法官的自由裁量權。從立法層面限定法定證據形式具有實踐意義,但是不應該過于僵化。限制法定證據形式的核心目的在于規范法庭調查,為不同種證據設定不同的法庭調查規則,而不是以法定證據形式為門檻將能夠證明案件事實的證據排除在外。對于大數據證據的認定也是如此,應該基于大數據證據的特征為其設定規范的調查程序。如果大數據信息依據其內容特征可以轉化為鑒定意見或者書證等法定證據形式,則以法定證據審查規則予以審查,如果不能轉化為法定證據形式,在證據形式合法性審查層面允許其以大數據證據這一新興形式準入,準入之后按照大數據證據自身特征進行法庭審查,主要包括數據庫操作人員就海量數據本身來源、體量設定、算法等問題出庭進行說明,這一部分內容后文會詳細闡述。
數據是人的行為活動在互聯網存儲介質中留下的可查詢的痕跡,大數據從字面理解,強調數據在量的層面的集合。所謂大數據,是指“體量超過了典型數據庫軟件工具捕獲、存儲、管理和分析數據能力的數據集”[3]。這一概念較為直觀地描述了大數據信息容量極大的本質特點。而突顯大數據算法特質的概念,則由國際數據中心(IDC)提出,它們認為,大數據就是“旨在通過實現高速捕獲、收集、分析,以經濟地從多樣的極大量數據中挖掘價值”[3]。我們之所以將大數據證據作為新興證據來研究它的證據準入問題和證據形式定位問題,就是因為它與現有的八種法定證據均有區別,不能轉化為任何一種形式或者被任何一種所包含。實踐中涉及大數據信息的證據很多,但只有符合大數據證據內部構成的信息材料才能被稱為大數據證據。大數據證據由兩部分組成:一是作為來源的海量電子數據;二是針對海量數據設定的算法結論,此處的算法多數通過建模分析進行,兩者缺一不可,刑事訴訟中的材料必須同時具備以上兩個要素才能界定為大數據證據。作為基礎的海量數據本身屬于電子數據,但是單一的電子數據與案件事實不具有關聯性,繼而不能作為證據使用,必須在統計一定數量的基礎之上結合科學邏輯進行分析,得出的結論才能證明案件事實。綜上,刑事訴訟中的大數據證據是指對于案件發生過程中產生的或者與案件有關的海量電子數據進行符合邏輯的模型分析之后得出的能夠證明案件事實的結論,大數據證據的落腳點是“結論”,而非哪個數據本身。
2012年刑事訴訟法新增了電子數據這一法定證據種類,我們要嚴格區分大數據證據與電子數據,避免實踐中將兩者的認定規則混淆。電子數據具有單一性,大數據證據是在電子數據基礎上衍生而來的,是海量電子數據在合理算法的整合下,通過分析得出的結論,它并不是海量電子數據本身,但是它的形成是以此為基礎的。大數據證據的內部構成一定包含算法,而電子數據不包含。這里需要重點分析大數據比對和針對一定數量的數據分析統計。大數據比對屬于查找線索的偵查手段,多用于鎖定犯罪嫌疑人,例如,通過人臉指紋或者其他信息的識別確定犯罪嫌疑人的真實身份或者準確位置。此類信息材料是在海量的電子數據中利用識別技術查找特定信息,以此內容來證明案件事實的,內部包含“識別技術”這一符合機器邏輯的算法,屬于大數據證據。通過云端儲存的數個電子數據分析特定人或者特定物的行為軌跡在實踐中也是非常常見的,例如,通過GPS系統中的多個信息片段還原出某一車輛的行蹤軌跡,此類信息材料僅是通過數個電子數據本身共同來證明案件事實,不包含算法,應該屬于集成型電子數據。如果是通過提取沿途監控錄像來還原行蹤軌跡則屬于視聽資料的范疇。如果是通過一定數量①這里的“一定數量”與大數據證據中包含的海量電子數據相比數量極少。的電子數據直接證明案件事實的證據不屬于大數據證據。例如,偵查人員通過查詢犯罪嫌疑人近期的聊天記錄或者網頁瀏覽記錄證明其于被害人之間存在過節,有犯罪動機,或者搜索過與犯罪相關的物品,此處的一定數量的瀏覽記錄和聊天記錄屬于電子數據,而不屬于大數據證據。大數據證據是基于海量數據結合分析得出的結論,此結論僅憑一個或者少量的數據是無法得出的。通過網頁瀏覽記錄、手機瀏覽記錄等多個信息證明犯罪嫌疑人的犯罪動機或者犯罪故意,此類瀏覽記錄屬于電子數據,內部的分析僅是對材料的簡單整合,既不包含機器算法,也不包含復雜的邏輯設定。
大數據證據和鑒定意見這兩種證據在實踐中存在著容易混淆的現象。從概念出發,鑒定意見是指國家專門機關就案件中的專門性問題,指派或者聘請具有專門知識的鑒定人進行鑒定后出具的判斷性意見。鑒定意見也包含兩部分內容,一部分是作為鑒定對象的檢材本身,另一部分是鑒定人的專業知識技能。它與大數據證據的根本區別在于后一部分,大數據證據中包含的算法一般是符合機器邏輯的機器算法,包含科技成分,而鑒定意見中包含“算法”是人的專業知識,例如,醫學知識或者精算知識等。實踐中,有一些情況是將大數據證據認定為鑒定意見②比如:眉山市東坡區人民法院(2018)川1402刑初44號刑事判決書;單縣人民法院(2019)魯1722刑初215號刑事判決書。,筆者認為,這樣認定并不合理,對于機器算法邏輯的審查尚不屬于我國司法鑒定的范疇,實踐中可以責令數據庫管理比對人員或者其他具有大數據建模經驗的人員充當專家輔助人的角色,接受當庭質證。
實踐中我們應該對于不同的證據種類進行明確的區分,因為不同種證據的審查判斷規則不同,審查側重點也不同。對于電子數據我們要重點審查是否按照規定收集、固定原始儲存介質;對于大數據證據我們除了要審查電子數據的收集、提取是否規范,還需要審查內部算法是否客觀;對于鑒定意見我們要重點審查鑒定人以及機構的法律資質。準確區分證據種類能夠有效防止法官的恣意擅斷。
大數據證據作為數據時代的新興產物,具有強科技性,與電子數據和視聽資料相類似,具有科技性的證據一旦進入訴訟環節和法官視野,與傳統的物證、書證、各類證言相比,更容易增強主觀的內心確信程度,通過影響法官自由心證使法官更傾向于相信大數據所主張的事實存在。無論是普通民眾還是刑事訴訟中的司法工作人員面對大數據證據,內心的潛意識會形成“鐵證”的認識,即使在與其他證據的印證過程中存在矛盾,自由心證也會傾向于相信大數據證據所主張的內容。越是看似科學、客觀的證明力強的證據越應該從源頭審查,因為這樣的證據一旦被認定會對案件事實的證明產生很大影響,所以,我們應該盡可能收集、固定、分析出真實的、不受污染篡改的、不帶歧視性的大數據證據。
明確大數據證據的法律定位是研究大數據證據的起點,關系到后續具體審查判斷規則的運用。對于大數據證據的證據形式是否合法學術界存在較大的爭議。有觀點認為,應該依據大數據證據體現的具體內容將現有法定證據種類作為其落腳點,即將大數據證據轉化為鑒定意見或者專家輔助人意見在審判階段予以審查[4]85-88。大數據分析尚未被列入獨立的鑒定項目,目前通行的以檢驗報告形式說明大數據分析結果的做法,是現實法律框架下有效且經濟的選擇。書證是另一種常見的大數據形式,多用于說明直接由大數據平臺或大情報系統導出的信息記錄,可以更為直觀明確地表達意見觀點[5]。有觀點認為,應當將大數據證據單獨作為一種新興的證據種類,未來的證據法中,大數據分析報告有必要單列出來。修改后的刑事訴訟法對于證據概念采用材料說,放寬了對證據資格的限制。例如,經濟犯罪案件中,提取一段時間內的賬戶資金數據后,通過建模進行可疑資金分析,資金大數據分析報告如果對案件事實具有證明價值,只要不違反法律規定,在刑事訴訟中可以作為證據使用[2]。有觀點認為,大數據證據無法在法定證據種類中定位的問題并非是無法逾越的屏障,應該將理論重心放置在法定的證據方法而非證據種類。大數據證據在證據方法上宜采用類似于電子數據勘驗的方法,在法庭審理過程中由控方傳喚從事數據庫管理的操作人員當庭展示,或者由鑒定人、專家輔助人出庭接受質證。證據方法具有一定的開放性,并不必然對應某一種證據形式[6]。
在當下的數據時代,越來越多的大數據信息進入刑事訴訟中,我們不應該否定大數據證據作為刑事證據的準入資格,研究的側重點在于大數據證據應該以何種形式發揮證明作用。大數據證據從本質上與電子數據、視聽資料、鑒定意見等法定證據形式均有區別,內部結構具有二元性,內部算法主要依據機器邏輯進行,落腳點是通過建模分析得出的與基礎電子數據無關的判斷性結論。筆者認為,基于大數據證據內部結構特征,不宜將其僵化地轉化為某一法定證據形式,更不宜以封閉式的證據形式直接將其排除在外,而應該以一種新的、獨立的證據形式登場,繼而擴大數據時代的刑事證據維度。
對于大數據證據的收集程序和審查判斷應該建立規范化的操作流程。經濟類犯罪案件和計算機信息系統相關犯罪案件中包含大量資金數據或者其他網絡數據的往來信息,單個信息是以電子數據的形式存在于網絡中,但是單個信息無法證明案件事實,我們必須分析整合大量信息得出與案件事實相關的結論才能作為證據使用。面對海量數據,不可能實現人工分析,必須借助科技手段建立數據分析模型,以量化嵌入的方式獲取結論。大數據證據的審查判斷包括兩個方面:一是對海量電子數據本身的收集和固定;二是對算法邏輯是否合理的審查判斷。
首先來分析海量數據的收集審查問題。作為基礎的海量電子數據本身具有大體量的特征,這一特征不僅是區分大數據證據的核心,還是收集審查的難點所在。現行法律對于單個電子數據的收集做出了明確的規定,但是針對批量數據的收集方式并沒有詳細的規定。大數據中的海量數據不可能是一個一個收集而來的,而應該是一部分一部分收集而來,在兼顧公正與效率的雙重價值下我們僅需要以批次為單位對幾大部分的數據收集程序統一審查,這樣不僅能夠實現司法資源的有效配置,而且符合海量數據的批量特征。例如,對犯罪時間段內同一系統中的賬戶往來資金統一凍結,或者查封同一網站中的若干賬號,以備后期模型分析使用。具體收集程序按照電子數據的程序進行,即由兩名以上偵查人員在見證人的見證下扣押、封存原始存儲介質,以錄像或者其他恰當方式記錄收集過程和封存樣態。可以被包含在大數據證據中的電子數據不再需要單獨作為一類證據予以審查。電子數據是一種互聯網產生的靜態數據,而大數據證據則運用了模型分析,加入了機器邏輯,可視為一種動態的數據結論。對于收集程序的審查除了常規的收集主體及步驟之外,還需要審查數據的體量、結點,即收集哪一時間段內哪些電子數據能夠保證海量電子數據的范圍是合理的。一般來說,我們應該收集犯罪行為實施的時間段內所有的涉案數據,對于犯罪行為發生前后的數據一般來說不需要收集,但是如果有證據顯示以上數據與犯罪行為的事實、犯罪主體的主觀心態、犯罪后的悔罪心態有密切聯系的話,仍然屬于證據的范疇,應該適當擴大收集范圍。
其次來分析算法邏輯合理性的審查。對于大數據證據內部算法的審查是研究大數據證據的難點,由于個案存在差異性,無法羅列不同案件的內部算法,筆者僅從宏觀角度對于內部算法邏輯的構建進行初步的研究。大數據在不同領域的應用發揮著不同的作用。在商業領域,大數據分析結論有著指導經營、拓展市場等作用,例如,美國沃爾瑪超市的大數據分析顯示,每到周末來購買啤酒的人高概率的會去買尿不濕。包括沃爾瑪超市的數據分析人員在內,許多人卻始終認為啤酒和尿不濕是兩個完全不相關的商品。上述案例所反映的原理正是大數據與傳統人類裁判者思維的不同[3]。超市經營者可以據此分析調整兩種商品的擺放位置,或者設置套餐銷售。大數據分析報告為經營者提供了新的銷售思路和方案,而這一銷售思路是在機器邏輯的客觀分析之下形成的,如果依靠人的主管認識很難得出這一結論。在科技領域,大數據分析結論可以作為研發新產品的依據,為流水生產線提供具體的操作流程。在司法領域,大數據既可以以一種新的偵查手段提供案件線索,也可以作為證據證明案件事實。不同領域的大數據分析結論都包含算法邏輯,如前文所述,內部分析都是經過機器的客觀邏輯進行的。算法邏輯的設定一般包括兩種:一種是機器本身識別出來的相關關系,例如,沃爾瑪超市對于購物習慣的數據統計,啤酒和尿不濕是不具有聯系的兩種品類,它們的聯系源于數據的客觀記憶,它是大數據統計下的客觀結論,完全為一種機器記憶,不摻雜任何人的主觀認知;另一種是人的思維下的因果關系,例如,通過大數據顯示甲的行蹤和上網記錄等內容推斷甲的心理活動,從而推斷甲是否可能存在犯罪故意。這種邏輯是基于人的主觀認知而形成的,因為刑事司法對于事實的認定強調具有法律上的因果關系,所以此邏輯更接近裁判者的思維和審判邏輯。
大數據證據的形成是否一定要遵循因果關系的邏輯是一個值得思考的問題。筆者認為不需要,我們之所以允許作為新興證據形式的大數據證據進入刑事訴訟中,就是因為它可以借助科技自身的力量,利用機器邏輯得出結論,對于案件事實的證明具有不可替代的價值,其他證據無法比擬,而利用判斷性結論證明案件事實的時候才需要遵循法律中的因果邏輯。大數據證據內部算法的運行模式是內部分析邏輯,利用大數據證據證明案件事實是外部分析邏輯,兩者應該分開考慮。英美證據法上的弗賴伊判例和多伯特判例為科學證據中蘊含的科學原理的審查設置了兩種不同的審查標準。多伯特判例中的“綜合觀察標準”取代了先前的“普遍接受標準”,在確定一項科學原理是否成立時,需要裁判者從多個方面進行驗證和審查。大數據證據在實踐中可以通過數據管理人、數據分析人、專家輔助人當庭接受質證的方式審查算法的合理性,主要通過檢驗、復查來避免算法邏輯存在歧視性。此外,機器邏輯運行下不可避免地存在錯誤率,我們運行機器邏輯本身蘊含的一定范圍內的容錯率,只是在最終認定案件事實的時候需要由法官整體把握。我們不得動搖人類作為司法決策者的主體地位,接受來自算法的支持而非支配[7]。
大數據證據具有衍生性、科技性、間接性等特點[8]。大數據證據與其他證據類型最大的區別在于審查內容的雙重性,即海量數據本身和算法結論。大數據證據的審查較為復雜,基于來源數據的多樣化和算法內在邏輯的異樣化難以設定統一的審查標準,目前只能從宏觀的視角梳理大數據證據的認定規則,大數據證據的認定規則應該遵循兩步走的審查模式,即通過證據能力和證明力的動態審查之后方能轉化為定案根據。大數據證據的獲得不僅涉及海量數據的提取,而且需要具有科技能力的機構進行建模分析,實踐中作為個體主體的辯方往往很難獲取,多數由偵查機關利用大數據偵查手段而獲得。基于大數據證據的公有性,我們要避免訴訟中出現控辯失衡的局面,未來應該從兩個方面消除大數據證據在審判階段的適用風險:一是將科學的庭審認定規則輻射到審前階段,規范審前階段的取證程序,避免有問題的證據進入法官視野,使其產生難以消除的認識偏差;二是通過細化認定規則為法官提供審查指引,科學判斷大數據證據的實用價值,即能否轉化為定案根據。大數據證據作為新興的蘊含科技要素的證據形式,它在證據能力和證明力的評價方面與現有法定證據形式均有區別,如何結合大數據證據的二元性內部結構規范它的證據審查判斷規則還需在實踐中逐步探索。