文特約撰稿人 張聞素
2017年5月,美國百大律師事務所Baker & Hostetler啟用了以IBM的Watson計算機為基礎的人工智能律師ROSS,對,Watson就是在2011年美國電視節目《危險邊緣》中打敗人類選手的那個機器,于是律師工作將被取代的爭論見諸各大報端。
2017年10月,AlphaGo Zero在沒有使用任何人類棋局數據進行訓練的情況下,三天之內通過自我對弈自學成才,將曾經打敗過李世石的AlphaGo版本趕下還未坐熱的神壇,之后又迅速擊潰所有前代版本。這揭示出在特定領域里,數據雖是淬煉AI的火焰有時卻不需要普羅米修斯帶來火種而進行自我點燃,亦說明AI已經站在無數人類巨人智慧的肩膀上不僅能自主學習而且還能學得更好,甚至迅速超越人類認識的局限開辟出窮盡千年萬世至今未能抵達的新疆域。
元芳,你怎么看?唐代武則天時期的狄仁杰在判案件關鍵之際總是習慣性地征求意見,但如今我們恍若隔世地發現,福爾摩斯般存在的法官、檢察官、律師等如“元芳”角色的司法業界同仁已經在線。人工智能、大數據、云計算、區塊鏈等技術被整合運用于法律平臺,日新月異的科技在法律行業的研發應用從而產生了更加高效精準的普世價值,公平正義就在彈指之間。人工智能法律平臺努力想要實現的是,更好地實現論點、論據、論證之間的智能鏈接和科學邏輯推演,把案件的偵察、審理和判斷等法律工作建立在數據、模型和卷帙浩繁資料案卷的科學分析和精準推演基礎之上。
2016年誕生的人工智能法律平臺名曰華宇元典,低調潛藏于中關村東升科技園。
“達特茅斯之夏”會議室的 “今日說法”
數九寒天的季節,我們在“達特茅斯之夏”會議室開始了熱騰騰的深度訪談。
“達特茅斯之夏”對于法律人來說是略顯陌生的詞匯,但在人工智能界代表著淵源,因為1956年夏季在達特茅斯召開的人工智能研討會揭開了AI序幕。
華宇元典專注于法律智能的研究和挖掘,在“實體識別引擎”基礎之上運用自然語言理解、法律邏輯挖掘、法律概念認知等綜合技術,結合專家團隊對法律行業的理解和實務經驗,形成法律文本知識挖掘的“法律認知引擎”,繼而跨領域地對律師行業、法檢行業、工商行業等等多元數據進行大數據整合,形成法律行業垂直數據庫,進一步融合形成以法律知識圖譜為基礎、通過自然語言處理和機器學習、提供法律認知能力的大數據知識服務平臺。
華宇元典的產品線貫穿于法律生態圈,迄今,元典已基本完成在法院端、檢察院端和律師端的產品鏈布局。2017年3月12日,撒貝寧“今日說法”走進北京三中院探訪高科技法庭,對話全國首個導訴機器人,解析法院三級聯動、智慧執行、步步為營、打擊老賴絕不手軟的斷案過程,節目展現了法院利用人工智能、單兵系統作戰、無人機偵查等科技手段促進判決結果精準高效且公平公正的全過程,其中就有華宇元典與兄弟公司華宇信息合作研發的“睿法官”的身影。
在法檢領域,華宇元典與華宇信息合作,開發了針對法院的“睿審·智慧裁判解決方案”,以及面向檢察院的“曉督·智慧公訴輔助系統”;在律師行業,元典智庫、元典律師工作平臺等互聯網產品也在全國多地律所投入使用。它們都由元典睿核作為智能底層針對不同業務場景提供技術支持。
元典專注于法律與人工智能結合與交集的領域,致力于為法律全產業鏈、法律生態圈研發智能產品,真正讓數據流動起來,讓智能滲透于法律人日常工作,幫助法律人創造更多價值。其實,華宇元典的母公司華宇集團已經在中國電子政務領域深耕細作十余年,憑借深厚的行業經驗,融合大數據、人工智能以及自然語言等技術領域的優勢,為各類政府機構提供優秀的信息化整體解決方案。
但是每個單點突破,都意味著海量內容梳理與技術鏈接,比如知識圖譜提煉過程分為幾個步驟:小樣本研究、監督學習、人工標記、人工檢索、強化學習、交叉驗證、原型開發、模型測試、部署試用、模型調整……再如已經完成的刑事50余個罪名可以覆蓋95%案件量的法律知識圖譜研發,已形成核心底層技術并運用到華宇元典的眾多產品中。極強的專業性,復雜的工程性,正因高端紛繁,所以興致昂然。
華宇和元典有機融合的來龍去脈與源遠流長
元,始也。象征源頭與事物根本,AlphaGo Zero中文譯名也是“阿爾法元”。
典,意味著基準與法則。立法文件編纂的集大成者,為法典。
“元典”是清華大學法學院許章潤老師的贈名。生其智謂之元,正其義謂之典。
華宇元典是華宇軟件旗下子公司,源于華宇17年的堅持專注與行業積累,在法院、檢察院信息化建設領域持續深耕,借道近年新興的人工智能技術順勢而為、尋風而上,打造法律AI新概念。
華宇元典創始團隊的初衷是法律和人工智能相融合,讓機器逐漸習得法律認知能力,在數據孤島間搭建連接的道路,使法律制定與實施更加公正、明智、透明,為喧囂世界帶來更好的規則。雖然人工智能的本質和范疇包括但不限于語音識別、計算機視覺、自然語言處理、信息檢索、機器學習、智能控制機器人、無人機與無人車等,但精準的AI科技形態與混沌復雜的法律領域無縫對接尚有距離,華宇元典自詡為法律AI的探路者,CEO鄒劭坤在多次公開演講中談到關于法律人工智能的真實當下與可能的未來,引用行業用語“有多少人工,就有多少智能”。
目前的法律科技領域仍然坑多水深,他們從未幻想指望把一堆文書丟給機器而坐等脫胎換骨的機器法官和機器律師,不僅僅是大數據與以往的關鍵詞檢索匹配,而是在尊重世界的復雜性而事必躬親地進行大量地晨昏朝暮的具體工作,付出巨大的經濟和時間成本,甚至踏踏實實地花笨功夫。
《三體》作家劉慈欣說,法律AI不過處在剛剛起步的史前時代。
隨機森林,曾為法官檢察官律師的核心團隊登臨忒修斯之船
華宇元典有很多間會議室,每間會議室命名都有一個故事。
“隨機森林”,1995年產生于筆者多年前曾經造訪過的位于美國新澤西的貝爾實驗室,在機器學習中,隨機森林是包含多個決策樹的分類器, 并且其輸出的類別是由個別樹輸出的類別的眾數而定,恰如多個人組成的攻關團隊,每個人都需要有其他人不具備的能力。元典以此命名會議室,一方面是技術團隊的象征,另一方面寓意元典本身就是不同行業和領域人才的相互融合。公司希望將不同知識、經驗、能力的人組合在一起,將融合智慧淬煉成機器智能。
“0725”是元典唯一一間以數字命名的會議室,0725是元典成立的日子;“薛定諤的bug屋”代表著元典對“bug無”的美好期待;“忒修斯之船”是法哲學中同一性的問題;“達特茅斯之夏”是紀念60年前達特茅斯會議AI興起的源頭……華宇元典用這些故事來啟發法律問題的解決之道并為行業帶來探索發現的靈感和曙光。
積沙成塔,集腋成裘。華宇集團在行業中有著深厚的積淀和品牌影響力,元典從事研究的領域也非常具有挑戰性和趣味性,創新立意和深厚底蘊吸引了曾為法官、檢察官和律師的優秀人才。CEO鄒劭坤、COO黃琳娜之前曾是檢察官、法官,從司法人員華麗轉身為創業者兼職業經理人,轉身的角度和力度都很大,如何實現職業角色的變換和跨界,中間肯定包含著有趣和湊巧的故事情節。
CEO鄒劭坤曾從事涉外法律服務,后在檢察院做公訴人,承辦過大量具有典型意義的新型案件,之后又輾轉做過私募和商事律師,是位喜歡挑戰和嘗試新鮮事物的“不安分”的人。在他看來,整個法律行業在大數據和智能化方面還較為滯后,不僅體現在工具上,還體現在意識上。這種局面一旦改變,法律行業的生產力會被進一步激發。而華宇元典就具有這樣的使命感。
COO黃琳娜畢業于北京大學法學院,是香港城市大學的普通法學碩士,既有法院的民商事審判經驗也熟悉律師市場。一篇訪談里提到她辭掉上一份工作時,她面對著幾個不同類型的offer舉棋不定,直到遇見元典,沒怎么猶豫就答應了這份邀請。這位笑意嫣然的南方姑娘在那篇訪談中說,接受這個邀請,是因為這個團隊對大數據的未來有深遠純粹的奇想,而且愿意付出日日夜夜的辛勞。我是個對大詞兒無感的人,不愛提夢想,說服我的與其說是愿景的堂皇,不如說是誠實且認真地對待當下真實局面的態度,點滴改善,逐漸突破。所以每次對外講座或交流,我都會潑冷水,說法律大數據是個水深坑多的行業。
華宇元典跨界融合了上市公司的穩健與初創企業的激情,也融合了法律人、NLP算法工程師、程序員、產品經理等思維氣質迥然不同的群體,并把他們變成親密伙伴,相互協同在法律科技領域深耕,探索用智能技術解鎖法律領域更多可能,如今這片如意快活的隨機森林已有近200名員工,包括本科和國內外碩博,他們既可以激烈爭執,亦可以相視大笑,這樣的狀態構成了快意工作場景。
以人工智能和算法連接并精準解析數據孤島
FOR LEGAL INTELLIGENCE,這是華宇元典官網首頁的英文關鍵詞。
讓機器逐漸習得法律認知能力,在數據孤島間搭建連接的道路。大數據、人工智能,在這些應用之間建立粘性和協同,是華宇元典以技術架構法律智能化的工作要點。譬如類案推送,必須要選擇跟當前案件的案情精確匹配的類案,才有真正的參考意義。案件里存在各類因素和要件,法律本身也往往存在大量爭議和模糊地帶,如何讓機器認知要素和整體案情,區分相似與不同,并且讓區分越來越精細,如何將法律人的經驗智慧轉化為機器智能并在實務場景中服務于法官、檢察官、律師是極具挑戰性的研究領域,也是迫待解決的核心問題。雖然最終這些智能輸出是機器完成,但是在研發過程中卻有廣大法律人的悉心參與。
之前發生的某起明星醉駕案,關于量刑眾說紛紜。當法律無法被量化、結果無法可視化的時候,爭議在所難免。華宇元典的智能量刑輔助系統針對此案立刻做出量刑預測,給出的量刑區間最后與實際裁判結果幾乎完全符合,這是大數據和人工智能使然。目前,在量刑建議機制和智能決策系統的輔助下,廣州、深圳檢察機關使用認罪認罰從寬制度的量刑建議采納率高達94.46%。
本質而言,并非人工智能替代了人,而是人工智能平臺系統輔助了人,單純的“法律+人工智能”結不出法律人工智能的果子,真正打開其寶庫的鑰匙并不完全在于機器學習和算法而在于人,在于法律和人工智能的連接,華宇元典正在深度嘗試并踐行。
法律智能領域的深度研究和豁達開放的競合態度
問渠哪得清如許?為有源頭活水來。華宇元典正在疏浚“法、檢、律、司”整個司法系統資源,為公民提供法務便利,讓審判更加公正高效智能,讓司法管理更加有據可依,讓可視化透明化且簡捷高效的“陽光司法”“一鍵立案”落地成真。通過數據挖掘自動搜索關聯信息,揭示預測法律風險點分布,為建立“精準案例信息推送”奠定基礎,為官方立法修法提供數據支持,華宇元典正是與法檢律司聯動工作的智能審判、智能司法的技術探索者、研究者和支撐者。
案多人少和冤假錯案等現象級矛盾亟需解決。正如凱文·凱利所言,科技的力量有兩種,一種是效率,一種是解決其復雜性。人工智能已經在改造法律行業,規模和速度不僅僅取決于技術進步的步伐,而且取決于整個法律共同體對于新技術新模式的接納程度。工信部前段時間發布的《新一代人工智能產業創新重點任務揭榜工作方案》對于行業而言將是重磅利好。
華宇元典非常重視域外交流,高頻的切磋探討從更專業的角度迭代躍遷,亦帶來更多思考。2018年5月,全國律協領導與臺灣律師公會聯合會組成的臺灣律師代表團一行到訪元典,元典作為大陸法律科技與法律智能探索者的代表與臺灣律師們分享了成果和經驗;6月,元典法律業務專家受邀赴美參加2018中美人工智能產業峰會 ,在法律分論壇展示了目前元典在法律人工智能領域的研究現狀……這樣類似的交流于元典還有很多,未來也會繼續下去。元典相信,在這條前路漫漫的法律智能之路上,只有學會聆聽與分享,才能少走一些岔路,多一些改變這個行業的機會。或許未來法律人工智能行業競爭將會更加激烈,但COO黃琳娜的態度卻不見憂慮,她幽默地說希望出現更多同路人,如此,創業途中便不會太寂寞。
訪談結束之際,她拿出華宇元典法律人工智能研究院主編的新書《讓法律人讀懂人工智能》,親筆簽名以字相贈“愿達特茅斯之夏的陽光照亮我們邁向簡單的旅程。”封面竟有凱文·凱利親筆題詞:AI law will be a new kind of law.
華宇元典2017年搬到“快樂工作+時尚生活”幸福指數高棲的創新人才生活圈東升科技園,并與園區環境、氛圍、資源、精彩紛呈的各項活動共享互動,對公司團建和企業文化起到了意想不到的推動和融合作用。業界合作伙伴戲稱華宇元典為“小獅子”,那么這只小獅子如何領跑世界成為“獅子王”,我們拭目以待這部法律人工智能領域的國際大片。
離開中關村東升科技園之際已是華燈初上,輝映著每扇亮著的加班加點的有故事的窗。