左衛民
法律大數據的出現,使得基于法律大數據的司法實踐與新型實證研究成為可能,并可能帶來法學研究方式的革命性變化。
當前這項研究存在若干誤識,如將“大量數據”“結構化數據”等同于大數據。“全樣本”是大數據最顯著的特征,然而,目前國內的法律大數據基本上只是部分數據,稱其為“大量數據”或更合適。相比于商業、社會領域的大數據,法律大數據具有官方性、結構化的的獨特性。官方化特征不僅使得法律數據的公開程度受到影響,也影響到法律數據的內容、類型及格式。基于法律機關的政策考慮,向社會公開的法律數據其實是按照司法機關的管理目標所生產的內容,而非有關法律實踐的充分、真實數據。真正豐富的法律大數據應由各種法律主體參與生產、制作并發布,具有全樣本、即時性、多樣化特征。現階段中國法律大數據實質上只是法律領域中的有限數據,也是角度特定的數據。
并且,大數據法律研究是一項綜合性、系統性工程,研究者掌握與運用相關研究方法的能力在很大程度上決定了研究的深度與層次。法律大數據研究的核心在于對海量數據的價值挖掘、處理,這就涉及上述數據的獲取、清洗與使用。目前我國在如何使用法律大數據展開研究方面,也存在方法的科學性不足等問題。
未來的大數據法律研究應致力于獲取全面、多樣的法律數據,探索并深入展開大數據法律研究的科學方式。不僅要思考如何更好地獲取法律大數據,還要探討如何正確認識與適當使用“大量數據”,更要充分利用統計方法展開大數據法律研究,探討如何科學使用機器學習等新方式分析法律大數據。此外,繼續重視對法律“小數據”的挖掘與運用,以及加強復合型研究人才的培養,也同樣重要。
(摘自《法學研究》,2018年第4期,第139-150頁。)*四川大學法學院教授[610064]