宋佳寧
天津工業大學,天津300387
大數據技術源于人類對測量、記錄、分析和認識世界的渴望,這種渴望促使互聯網技術不斷成熟與發展。在信息技術的不斷進步和互聯網使用率攀升的背景下,各種智能終端和互聯網客戶端的數據流量也呈爆發式增長,“大數據”一詞應運而生。“維基百科”將“大數據”界定為“一種由不同來源的數據組成的龐大的數據庫。”從字面意思來看,該定義更加強調“大數據”的外在表現形式,即“龐大的數據庫”。而美國互聯網數據中心(DCCI)則從技術角度更為精確地界定了“大數據技術”。該中心將“大數據”描述為通過高速捕捉發現,從分析強大的數據流中獲得有價值的一種新的技術構架。故大數據又被描述為“因數據處理技術和工具蓬勃發展而引發的信息爆炸式增長的情形。”[1](P1)
一般意義上的“大數據”具有以下四種特點:即超大、高速、多樣和價值巨大(見圖1)。其中,超大性是指傳輸數據的數量及流量超大。在收集原始數據時,大數據技術的運行方式是通過互聯網用戶端對數據進行一個全樣本的收集,即對與樣本相關的所有互聯網數據進行收集,追求“全”。高速性是指數據處理速度的高速性。多樣性是指數據來源及形式的多樣性,主要體現在數據來源不僅局限在互聯網,還覆蓋物聯網;數據形式包含音頻、圖片、視頻和模擬信號等。價值超大是指應用程序通過特定模型結合自然科學、人文科學等手段分析大數據,同時將得出的數據結果反作用于社會。現階段,一國在科學數據上的優勢和將數據轉化為信息和知識的能力,基本可以決定該國科學研究的水平和國際地位。近年來,美國和歐洲等發達國家和地區已經將大數據技術和對數據開發和利用能力提升到了國家科技戰略的高度,大力研發相關技術。

圖1 大數據運行圖
大數據的巨大價值,在近年來國內外的一些科研成果中也得到了證實。大數據技術的出現,標志著過去在小數據基礎上不能夠測量和記錄的很多事物都可被數據化,激起了人們的關注與研究熱情。科學家們通過大數據技術能夠更加深入地探索世界,從事以往無法進行的研究,解決以前難以解決的科研問題。例如,在生物學領域,科學家們利用一系列的大規模氣候模型數據和古生物化石數據等,在生物多樣性研究方面取得突破進展。在金融學領域,經濟學家通過對大數據的分析和處理,為宏觀經濟及企業提供可靠的決策。在高能物理領域,物理學家通過采集海量實驗數據,尋找到了希格斯拉立子,等等。
與此同時,法學教育學者也緊跟大數據技術。[1](P1)現階段大多數法科教育過程中面臨靜態法律數據多,動態法律數據少;法律數據分析多,法律數據模型分析少;法律規范數據多,法律行為數據少等亟需解決的問題。大數據技術對上述問題的解答,使得其在法學教育領域顯得尤為重要。近年來,各國高校均探索在法律碩士教育中應用大數據技術的可能性。例如,在案例教學中,通過大數據技術,在法律碩士案例教學中可以將判決書數據化,進而構建更為專業的法律數據檢索平臺;在實踐教學中,通過大數據技術使法律行為信息化,形成數據源,進而開展相應的法學實踐研究工作;在學生就業領域,通過將學生信息與招聘信息進行數據比對,優選就業方案,以提高學生就業率等。目前,包括美國加州大學伯克利分校、麻省理工大學、華盛頓大學、哥倫比亞大學、伊利諾伊大學香檳分校、芝加哥大學、紐約大學、日本應義塾大學、大阪大學、名古屋大學、韓國釜山國立大學以及我國的北京大學、上海交通大學、中國人民大學、東南大學[2](P194)等國內外高校,均在法律碩士階段開設“大數據與法學”或“互聯網法學”等特色課程。其中,東南大學法學院還在其法學一級學科博士點下設立“大數據與互聯網法學”,并與該校入選“雙一流”學科建設的計算機科學與工程學院強強聯合,在法學院博士生與碩士生中開設了《大數據與互聯網法學》課程,[3]不僅實現了法學與計算機學科交叉學科研究的優勢,且為人民法院的“大智慧戰略”及“智慧法院”建設發揮了積極的作用。
信息技術的迅猛發展和普及,在將人類帶入大數據時代的同時,也對傳統的法律碩士教育模式造成了巨大的沖擊。近年來,國外的一些頂級法學院均將大數據研究提升到了學院戰略層次,嘗試案例教學、實踐教學和學生就業領域納入大數據技術,積累了諸多值得我們學習的經驗。
案例教學是目前法律碩士教學中的重要形式之一。傳統的案例教學模式存在著一定的缺陷,最典型的就是在面對數量較大的案例庫時,學生難以高效、快速地檢索出所需案例,很難調動起學生的學習積極性。基于此,國外部分法學院將大數據技術引入到法律碩士案例教學中,嘗試利用大數據技術解決上述問題。例如,哈佛法學院與RAVEL 法律大數據公司合作,形成擁有4000萬法律文獻資源的案例平臺。目前該平臺不僅為學生對法律主題或判例進行搜索提供協助,同時還能形成交互式圖形,顯示與主題或判例相關的案例,將引用最多的案例進行標識,使學生可以較為便捷地定位到關鍵案例,[4]極大減輕了學生案例檢索的工作量。
除此之外,美國部分法學院還通過大數據技術逐步引入面向全球的大型公開課,給美國法學教育革命注入了新鮮血液,受到美國教育部門及業界人士的廣泛關注。以發展較成熟的Coursera為例。它能夠提供300 多門課程,正式注冊人數超過300 多萬人。可以預見,將來會有更多類型的免費網絡法學課程出現,質量上乘的課程內容會吸引數十萬甚至數百萬學生選讀,學生可以結合自身情況規劃學習及考試,獲得相應學分。[5](P76-79)這種模式集多向式、群體式和互動式等優點于一身,實現了對法學教育資源的充分發掘和有效利用,極大推動了整個美國法學教育制度的現代化變革。
實踐教學是當前法律碩士教學中的重要組成部分,其主要形式是派遣法律碩士研究生去相關司法機關實習,并通過實習觀察,學習和體會如何將法學理論知識應用于現實案例中。國外部分高校針對此類實踐活動不斷地探索將大數據技術應用進來。
新加坡國立大學法學院在法律碩士階段設有數據分析學課程,用于支持法律等多種學科在內的數據分析解讀。2017 年5 月,新加坡宣布在未來5年內投入1.1 億美元到人工智能和數據科學領域。其中的一項計劃就是由新加坡國立大學、南洋理工大學以及新加坡科技研究局等研究機構合作創建新加坡數據科學聯盟,加強學術研究機構與法律產業間的合作,這其中就包括對法律數據的研發,從而應對現實世界的挑戰。
美國法學教育領域提出Legal Tech 的概念,旨在通過數據科技提高律師工作效率,如在項目管理和收費及法條檢索方面進行創新。美國的一家律所(Baker & Hostetler)已將人工智能機器人用于負責協助處理企業破產的法律事務。同時在自動化辦公、法律檢索、電子證據收集及客戶維護等方面也已引入大數據進行輔助。不僅如此,還運用大數據對可能發生的法律行為作出預判。例如,紐約等地警察機關通過法律數據庫對可能發生的犯罪行為進行預測,對預測到犯罪行為高危區加派警力巡邏,大大降低了該區的犯罪率。通過實習實踐,學生能夠更為直觀地了解到大數據技術在律師事務所解決法律事務中所起到的重要作用,不僅能夠提高學生的學習興趣,還能提高學生工作效率,具有一舉多得的效果。
在大數據時代,隨著美國硅谷數家法律科技公司的成功創業,硅谷迎來了美國法學院的一批又一批畢業生,他們的就業思維由進入律所轉變為跳出律所。例如,由《斯坦福法律評論》和《哈佛法律評論》的主席創立的法律科技公司Casetext,該公司通過將大數據處理過的數據包發送至各地的司法參與人員,使他們對案情、爭議焦點、法律分析以及判決結果等信息有著更為清晰的了解,同時還對判決書進行標注,注明其他的參考資料,極大地提高了查明案例的效率,獲得了業內的好評。目前,Casetext 公司已獲得了180 萬美元的融資。由此可見,大數據不僅使法學院的畢業生的就業思維發生一定轉變,同時也加快了法律相關工作內容智能化的腳步。
綜上,在大數據時代,國外部分高校緊追時代潮流,在充分運用大數據技術的基礎上,分別在案例教學、實踐教學和學生就業指導等層面加入“新鮮血液”,通過不斷的探索與創新,力圖提升學生的學習興趣和工作效率,拓展其科研廣度和寬度,對國內高校的法律碩士教育提供了寶貴的經驗。
基于大數據的教學科研活動,是對法律碩士教學具有有效分析預測和控制的關鍵。利用大數據技術研究反饋問題,分析法律領域的決策過程,探究法律行為的因素已經開始在國內部分高校適用。
國內高校首先是在法律數據庫的建立和分析方面進行探索。隨著法律文獻的數據化發展,法律數據庫日益增多,如綜合性的法律數據庫中國知網,還有專業性比較強的法律數據如北大法寶、北大法意等。這些數據庫的建立,極大地方便了大數據的采集和分析研究,為法律碩士案例教學的工作提供了巨大便利。
在以往的法學教學和科研中,學生往往需要從事大量的數據檢索工作,但基于技術和數據庫有限等因素,學生通常苦于找到有效信息,即使找到信息,也無法確定信息的準確性與權威性。通過對專業性、具有針對性的法律大數據的運用,可以有效培訓學生使用大數據進行科學研究的能力。比如,學生可以在理論學習中通過北大法寶等數據來進行問題分析,了解本學科的研究領域的前沿信息和研究發展的脈搏。
隨著數據密集型科學研究的興起,迫切地要求將法律大數據納入到正式的法律碩士教育。例如,中國政法大學圖書館在法律數據庫的建設與升級過程中,注重對數據庫的服務轉型、技術更新和制度創新。通過數據出版應用機制維護,促進法律大數據與文獻之間的互相操作。此外,國內部分高校形成的“法律大數據聯盟”更是此類做法的推陳出新。例如,2014 年10 月25 日,清華大學公共管理學院舉辦大數據與公共風險治理論壇。同期,南京郵電大學牽頭發起的中國法律大數據聯盟正式成立。該聯盟發起高校包括北京大學法學院、清華大學信息科學與技術國家實驗室、工業和信息化部電信研究院知識產權中心、南京郵電大學信息產業發展戰略中心、中國政法大學企業法務管理中心、北京郵電大學網絡科技研究中心等,宗旨是探究法律大數據驅動下的立法研究、法學研究、法律應用和法律服務升級與轉型,共同推動大數據在法學教育領域的應用。[6](P46-47)
大數據不僅可以運用在法律碩士的案例教學中,還可以應用在法律碩士的實踐活動中。例如,法律碩士在對司法實踐中的法官的自由裁量權問題進行相關研究時,可以通過對法律大數據的分析,掌握在司法實踐中法官自由裁量權的實際運用情況。通過對法律大數據的可視化分析,得出影響法官對當事人進行判刑的考量因素。在民事訴訟中,如采用的優勢證據規則,到底是一方當事人的證據要具有多少優勢,才能形成優勢裁量。就目前來說,主觀意向太強,當事人接受度不高。這時利用大數據技術,可以將其證據之優勢量化、客觀化,使得當事人更加直觀地理解并接受司法的判決結果。
對于法學實踐預測研究不僅局限于此。以律師行業為例,傳統的律師行業主要是使用典型法規案例模式的數據庫和口口相傳的傳統律師團隊的營銷推廣模式。在引入法律大數據后,當事人通過一些專業化的法律大數據平臺了解相關法律,得出自己對案件的看法。同時律師也可以通過法律大數據平臺進行預測了解律師實務的情況。例如通過對判決書的分析,掌握律師勝負的基本數據,并通過這一數據對律師進行推薦和評分。這樣將兩種模式結合在一起,可以在用戶進行咨詢時,創建個人數據庫,更為精準地匹配律師和當事人。在整個訴訟流程中,利用有效積累的案件數據,將大數據運用到案件的論證階段、磋商階段、辦理階段,和歸檔及結案階段。通過大數據進行了前期的預期判斷結果,與最后的裁判結果進行對比,對此類案件的標簽化進行調整。
國內已有少部分高校在指導法律碩士畢業生進行就業時,建立了相關的研究模型,幫助法律碩士研究生尋找到匹配度高的就業崗位。通過設置控制變量,結合對法律碩士畢業生的相對優勢、匹配度和技能進行綜合評定。最終通過數據分析,在其就業前期對就業預期進行一個感知度和匹配度等方面的預測,從而科學地引導學生就業。在學生就業工作結束之后,再對數據進行回訪,來檢驗該研究模型的科學度。實現高校法律專業人才培養模式的改進,多視角考察高校法律專業人才培養模式改革創新的影響因素,從而實現高校人才與社會的雙軌對接。
高等教育的目的在于人才培養,而法律碩士教育的最終目的導向是培養出能適應社會變化的高級法律人才,使這些學生更好地投身于社會主義法律事業,產生積極的社會效應。在大數據時代,國內部分高校在法律碩士的案例教學、實踐教學和就業指導方面已走在前面,這些對天津高校將大數據技術應用于法律碩士教育中,提供了操作和學習的樣本。
法學的科學研究已經進入大數據時代,很多高校已經意識到法律大數據分析和處理的重要性,眾多高質量的數據提供商,如國外的路透社(Reuters)等已經創造了市場先機,很多國內高校也在快速建立自己的競爭戰略和競爭信息數據平臺。相對來說,天津市多數高校在法律碩士教育、教學中有效運用大數據技術還較為薄弱,特別是在法律數據庫建設方面還需不斷完善。
首先,天津市所有高校尚未設立專門機構從事法律信息數據的管理、交會、分析與發布等工作,表明天津市各高校的法律信息資源還有待進一步整合。其次,在法律碩士教學方面,天津市各高校對法律大數據的運用還停留在機械化的初級階段,且并未開展大范圍的應用。原因在于,由于缺乏高層級的法律法規及政策支持,天津市高校在公共資助產生的數據的共享和獲取方面仍處于較低水平。即使是那些被納入有關工程項目中可開發共享的數據,也只是公共資助產生的數據中的一小部分,且這些數據的開放程度不具有可持續性。將法律大數據與法律碩士教育聯系,不僅是機械的簡單相加,而是要從實質上改變教學方法。如果只是將以前的教學方法換了一種形式,自主性雖有改善,但并無法大力調動學生的主觀能動性,重理論輕實踐的局面也沒有得到有效改善。那么大數據在法律碩士教育領域的探索與應用就失去了其重要意義。
就天津市多數高校法律碩士教學現狀來看,主要有以下三種教學方法。
一是強調課堂講授的傳統教學法。整個教學活動是以教師為中心的,學生跟著老師走,這種教學方法較為枯燥,且有“灌輸式教學”嫌疑。二是屬于最近大力倡導的案例分析教學法。在課堂上,老師把一些有綜合性、典型性及具有一定難度的案例拿出來,為學生進行分析講解。通過案例分析,學生在老師的引導下對案例如何解決進行討論,充分發揮學生的能動性,使學生通過小組討論、課堂展示、模擬法庭、法律診所等多種方式進行自我思考和分析,最終形成“案件解決方案”,這種強調理論與實踐相結合的案例教學法不僅能夠較大程度引發學生的興趣,更能加大法律碩士教學中學生的參與程度。三是科研教學法。要求對于學生實行導師制,導師通過對法律碩士的直接交流和答疑解惑,在夯實法學理論基礎的同時,對其論文進行指導,組織學生從事一定的科研項目或者社會調查。[6](P46-47)強調導師對學生參與科研活動、理論學習和實踐訓練中所起到的引導作用,一般來說,導師的項目或研究方向即為其名下法律碩士學生未來2-3年的研究方向。學生在這種教育模式下缺乏“發言權”和主導性。
對大數據的系統挖掘與研究,將成為未來高校法科學生教育教學培育的趨勢,領跑“雙一流”高校法學學科建設,必然會以大數據作為其發展的核心技術。
1. 協同構建各高校數據共享平臺。數據價值得以充分發揮的關鍵在于其流動性和可獲取性,數據開放被認為是未來科學的一項基本原則。大數據技術應用于法律碩士教育的前提與保障,是大數據的獲取、存取與共享。法律碩士在進行理論研究時,往往需要對多方數據(如來自法院、律師行業和互聯網數據等)進行分析與集成建模。這就要求法學研究者必須與政府、企業等擁有龐大數據庫的組織進行合作。這種現象在一定程度上改變了傳統的法學研究模式,要求法學研究者不僅依賴于個人力量,而且要建立相應的團隊。但是高校在進行課題研究時,往往是獨立進行數據分析。這便導致兩大問題的出現:一方面,不同高校研究團隊對收集數據規格要求不同,這種差異性使得數據的共享存在困難。另一方面,由于各高校科研團隊資源有限,使得各高校在收集數據方面不能窮盡。同時,各團隊之間存在競爭關系,大多情況下要求各高校科研團隊主動進行數據共享的可能性并不大。因此,在大量收集數據時,天津市各高校可有針對性地建立數據檢索和共享服務,協同構建面向天津市內法律碩士分析研究大數據的存儲與共享平臺,這樣能夠大幅度提高科研效率,使科研人員專注在方法上的創新性研究。也可協同構建一個松散且易構的研究數據平臺,用于天津各高校法學科研團隊獲取、儲存與共享相關數據,同時開放給平臺內的其他團隊,在不進行數據轉移的情況下進行動態共享,并通過采取法律知識構建數據檢索與表示體系,對不同來源和形式的數據進行統一管理。此外,在開放法律大數據時,還應注意數據的使用效率。可以從開放數據的形式入手,注重開放的明晰度,使數據易得,同時還應將開放數據的構架設計得易懂。只有確保法律信息和數據在開放程度上的大且上手快,才能使法律信息和數據能夠高效地被法律碩士研究生所獲取和利用,并且能夠推動法律碩士教育教學的發展和創新。
法律大數據的開放改變了以往法律碩士教育領域信息不對稱,比如對自身專業能力和水平無法客觀評價等問題。法律大數據的分析與預測,成為法律碩士進行多課題科研的重要手段。適當的將法律大數據合理合法地對社會上的需求群體開放,把法律大數據不局限在法律碩士教育中,不僅能夠有利于提高法律碩士教育教學運行的效率,還有利于全社會法治共識的形成,產生積極的社會效應。[7(]P162-178)
2.加大對不同學科背景的法律碩士人才培養。我們在運用大數據解決問題時,要清楚地認識到大數據僅是一個工具。大數據加上人腦分析才可能使決策結果最大程度地傾向于正確。為了利用現有和未來產生的海量數據和數據技術,天津高校應加強對新的專業人才的培養,包括數據分析師與數據工程師、數據管理員、數據檔案員等,這些人才的培育對大數據資源的成功管理和利用起著至關重要的作用。面對快速變化的網絡技術,天津各高校可以聯合舉辦相關教育講座和培訓活動,以便使法律碩士更好地使用和管理這些數據和技術。通過建立數據科學研究機構,在法律碩士培養計劃中開設數據科學相關專業課程,促進法律大數據科學基礎理論的發展,加強有關數據存儲管理分析,重視法律大數據的可視化研究開發。同時還要鼓勵建設多學科的科學數據中心。
法律大數據的可視化與傳統的法律數據相比,內容比較豐富,更加廣泛且復雜,所以對于大數據的探索分析,很大程度上依賴于可視化工具處理后的人為的數據解讀。此外,法律不同于自然科學,解讀法律大數據時,要更多地考慮人類行為因素,因此帶來更大的不確定性。所以在對法律大數據分析的時候,需要更多的參考心理學和行為學的理論方法,對大數據背后的規律和隱含的趨勢進行合理的描述和推演,從而更有效地服務于法律碩士研究生的相關科研工作。為解讀法律大數據中隱含的信息,相關科研人員需要更高的素質即多學科的知識背景,這就要求相關科研人員的理論知識不僅僅局限于法學領域,同時必須具備心理學、計算機科學、社會學和統計學等相關的知識背景,這也需要天津各高校加大對不同學科背景的法律碩士研究生的培養。
3. 注重大數據在使用時的數據保護。天津各高校在法律碩士教育領域對大數據進行利用的同時,要注意對法律大數據的保護。法律大數據的隱私保護以及大數據是否受知識產權的保護,一直是一個存在爭議的問題。一方面,科學技術的發展對法律大數據的依賴越來越大,開放與數據共享已經成為法律碩士研究生教育中不容忽視的驅動力量。另一方面,隨著人們對隱私權問題的關注,將來有可能會對一些重要的信息訪問有所限制。法律大數據涉及眾多個人及組織的信息,一旦造成數據危機,將會給這些個人和組織造成巨大損害。
法律碩士研究生在進行相關問題研究時如何使人們從中受益,如何進行利益共享,同時對大數據進行數據隱私保護,是大數據在法律碩士教育應用中面臨的一個問題。因此,高校在進行法律大數據的使用時,應盡可能地找到保護當事人隱私的方法,確保隱私信息的保密性,這樣才能在大數據研究中獲得公眾的信任。涉及個人的大數據情況越來越普遍,相關立法人員應該接受相應的培訓,制定法律以保護個人不會因個人隱私而被歧視。天津各高校應當在法律大數據使用時,注意數據公開、數據獲取和數據分析與個人隱私保護之間的關系,并針對法律大數據的保存,建立相應的監管機制。考慮到實際情況,在實踐中促進我國數據開放政策和相關法規的完善。在結構上,形成既有國家級政策和宏觀性的法律要求,也有為科研提供資助的政府部門及數據維護政策和實施指南。面對這一問題的解決不僅需要數據的開放政策和相關立法的促進,還需政府的監管、高校的積極維護,使用者應以長遠開放的眼光,對待法律大數據在法律碩士教學中的應用,做到合理適度地運用法律大數據,以法律大數據為契機,不斷改進法律碩士教育,培養出優秀的法律人才,從而更好地實現司法公平、公正,維護司法正義。
4. 實施大數據科研激勵機制。天津市各高校應積極實施有關法律大數據的科研激勵機制。天津多數高校現有的科研機制,并未將這些數據產生的影響納入到其貢獻和聲譽,這些在很大程度上影響了科研機構和人員使用法律大數據的積極性。天津各高校可適當考慮將數據管理和開放納入科研項目資助條件,并對驗收內容加以要求。改進科研項目的資助模式,將數據共享作為公共資助項目的資助條件之一,將數據管理和共享成本納入項目申請書和任務書,將數據管理和共享作為項目驗收。改進科研成果的發表和審評機制,將數據作為科研成果的一部分發表,并重視數據應用,將其成本計入項目資助經費加以支持,考慮如何促進新的科研激勵機制的形成。在新的激勵機制中,使法學科研機構和法學科研人員在數據開放上所做出的貢獻,將納入評價范疇。從而為使數據的價值的充分發揮,科研的良性競爭,建立設立可衡量的數據管理和共享成效指標,不斷地促進大數據在天津各高校法律碩士教育領域的探索與應用。
綜上,大數據時代,天津市高校如何緊抓這一機遇,將法律碩士培養水平更上一層樓,是一個非常值得討論和研究的問題,也是一個需要持續關注的研究熱點。