侯澤琦
(北京理工大學 法學院,北京 100081)
算法解釋與算法透明成為綜合業界與學界在進行橫跨文理的技術考量后,形成的技術性與可行性相統一的算法規制手段,并在《互聯網信息服務算法推薦管理規定》(以下簡稱《算法推薦規定》)中得到確定?!吨腥A人民共和國個人信息保護法》與《中華人民共和國反不正當競爭法》同樣要求算法公正與透明,但是規定較為粗略,缺乏行之有效的實操內容。歐盟《一般數據保護條例》(GDPR)要求,企業必須從技術與組織結構層面告知算法決策的邏輯。由于算法評估、備案等公開機制均過分強調監管部門的作用,這在增加治理成本的同時,也忽略了市場自律的可能。專利公開制度是賦予企業合法壟斷,以公開換取競爭優勢的重要制度;而算法可解釋的核心在于,算法歧視的主觀行為能否通過公開的技術指標得以體現。那么,專利公開的技術內容能否既滿足監管部門所規定的公開披露要求,又使企業在與商業秘密不沖突的前提下,利用專利公開最大化市場競爭力的同時,滿足算法透明度的要求,最終使專利公開制度作為企業自律的一環,并與國家主導的算法審查制度相配合,實現企業以趨利避害為基礎進行自律。這將是筆者主要探討的問題。
《算法推薦規定》對于算法解釋、算法透明概念以及二者的關系未進行明確的規定,學界對此也看法不一。筆者認為,算法解釋是以技術為出發點,利用自然語言與可視化的方式,對算法設計的決策邏輯與法律風險向有關機關或個人進行解釋。算法解釋可以細化為可執行的標準和程序,且解釋對象為具備技術背景的監管部門、評估方、個人。算法透明,則是指算法主體披露算法應用、設計參數等一系列信息,從而獲得外界的信任[1]。算法透明本身具備一定的政治性,且評判標準主觀,難以形成規范化的可執行標準和程序,超出了法律與技術的范疇[2]。其目的在于,使監管主體和公眾,了解并信服其算法安全性。有學者提出,算法的透明度應當通過參數可視化、實例解釋等方式進行公開[3]。筆者認為,這種方式的本質依然是算法解釋,因為算法解釋與算法透明二者是手段與目的的關系,所以算法主體通過算法解釋的手段進行算法公開,從而獲得適度的算法透明度,進而達成企業公信力的提升。因此,《新一代人工智能發展規劃》在建設新一代人工智能算法體系的過程中,要求實現具備高可解釋性、強泛化能力(算法兼容性)的人工智能[4],但并未提及算法透明的相關內容,可見算法解釋更適合量化并作為法律標準規制的客體。專利制度中,企業遞交的算法專利申請書與說明書,必定需要列明算法的數據服務方法、算法模塊結構等原理,并附上方法實施例,與上文提及的參數可視化、實例解釋等公開方式相似。因此,下文將探討算法專利的公開內容,是否屬于算法解釋且能否達到適度的算法透明要求。對于《算法推薦規定》中的算法透明不再予以討論。
在明確算法解釋之前,要明確算法的黑箱來源,才能找準體現算法主觀行為惡性的算法技術指標。首先需要明確的是,并非所有的算法都具備黑箱性。人工智能算法的目標在于利用計算機模擬人的思維,而人的思維在數學上可以抽象地表示為各類函數及其總和,也即算法的核心構成,是其作出決策的關鍵[5]。相應地,目前市面上主要存在三種類型的算法:線性(linear)、決策樹(decision tree)、神經網絡(deep network)。線性算法通常具有優秀的解釋能力,因為線性回歸模型可以很直觀地展示每個樣本數據參與模型運算的特征權重,由此可以清晰地知道決策原委。決策樹算法可以清晰地看到每個節點和問題,并且可以通過結果向上逆推得到決策過程,看似是一個既可解釋又能支持復雜模型的算法,但當決策樹模型復雜到可以構成隨機森林(random forest)的時候,其就不再具備自解釋性。深度學習算法本身就是由多層非線性函數構成的,同時,算法的應用需要經過數據訓練后形成神經網絡算法模型,訓練數據也會影響算法的決策[6]。此外,還需引入確定推理與不確定推理概念。確定推理包含法律人熟悉的經典演繹推理,在定罪量刑中得到了廣泛應用,也是行政與審判自動化的技術基礎;不確定推理則是基于統計學而來的,輸入值差之毫厘,將會因為落在不同的概率區間而導致輸出值謬以千里。神經網絡算法就是由大量的“不確定”“非線性”系統層層疊加得到的[7],導致神經網絡中關鍵參數的波動范圍在整個訓練過程中無法可控,難以使用普通人熟知的自然語言予以解釋[8]。
算法解釋的核心還是要依賴算法解釋技術的進步,而法律在其中主要承擔規訓技術,并設定可選解釋路徑和分場景分級別設定相關技術參數披露紅線的作用。筆者將其總結為法律對算法解釋的定性、定量、定體功能,通過對算法解釋應當達到的透明度、解釋路徑、程序規范等進行綱領性、結果性的指引,并通過技術標準、指南等技術性、靈活性規制手段進行具體細化。
算法解釋的定性,是指通過自然語言對規范性文件中要求的算法功能進行解釋,表達出算法分析與決策過程的實質,由此作為算法解釋是否滿足要求的判定原則。筆者認為,算法解釋的理想目標是全方位地解釋算法模型的工作機理,并準確、全面、清晰地告知分析與決策的步驟。但是,囿于算法的復雜與解釋技術的限制,現階段尚未有技術可以達到此目標。因此,算法解釋的定性應當以“信任”為判斷標準,而非“透明度”。由于人腦的決策實際也是一種黑箱,但是基于語言交互的便利與法律對行為的限制,人與人之間較易產生信任。所以,無需苛責人工智能算法需要在完全透明的狀態下才能獲得信任,現階段算法解釋定性應當要求算法使用者在考慮模型使用數據、適用場景、解釋對象的基礎上,盡全力以人類能夠理解的方式解釋算法的學習與決策機理,并驗證其可靠與可信度,最終獲得解釋對象的認可[9]。
算法解釋的定量在于將具體評價參數標準化,即探尋上文提到的算法的主觀惡性反映在哪些具體的技術指標上,一旦算法解釋的各類參數在合理的范圍內,即可認定為行之有效的算法解釋,并達到算法透明度之預期?,F階段,《算法推薦規定》對算法機制機理、模型、數據和應用結果提出了披露要求,即要求算法解釋的定量以技術說明、評價參數等形式出現。目前,軟件工程中的軟件驗收說明書與此有類似之處,會對軟件的各項技術參數、穩定性等制定技術性評估標準,筆者將其歸納為四個評價方向并作為算法解釋定量的技術標準:公平性(fairness)、可信任度(trustworthiness)、可達性(accessibility)和交互性(interactivity)、因果關系(causality),并將在下文進行詳細論述。
算法解釋的定體在于為達到算法解釋的定量要求,算法主體采取法律或政策許可的固定體例或形式向有關機關或個人進行算法解釋。目前主要有兩類解釋形式:其一,在算法模型構建之初就考慮到事前可解釋的需求,從而在算法設計中預留解釋接口或直接采用自解釋的算法設計,但目前市面上絕大多數算法并未采用此種先進設計理念。其二,在現有算法模型的基礎上對輸入數據進行預處理,并通過直觀展示輸出數據的變化從而對模型進行解釋[10]。在技術上抽象體現為調整模型內部參數,判斷參數對于結果的影響,或者向輸入樣本中添加擾動,探索表征向量來對系統中不同變量的重要程度進行評估,尋找系統判斷決策的依據。在技術上大致有可視化、基于局部近似、基于黑盒測試三種技術思路[11]。未來,可由行業技術標準或者《人工智能算法金融應用評價規范》這類行業標準在凝練各類算法解釋技術路線的基礎上,分場景分級別對各類算法主體設定規范可行但又靈活可選的定體解釋路徑,給予企業多種類但又確定的指引。
綜上可知,算法解釋是一項技術性很強且未成熟,但又亟須法律規制的行為。采取現有制度的適應性改造與行政法規、行業標準這類靈活性較強的規制工具,將有助于算法技術進步與算法侵權治理的有機平衡?,F階段,國家立法導向與學界觀點主要集中于通過國家行政主導的方式,以公權力工具鏈展開算法治理。知識產權制度作為法律與科技結合的典型產物,不應在本輪科技變革中缺席,因此,下文將探討以現有專利權利申請書、說明書、附圖、實施例為組成的專利公開文件,其內容能否滿足上文中算法解釋的定體需求,并呈現出與《算法推薦規定》要求一致的算法解釋定量標準,從而滿足算法解釋定性要求,最終實現算法適度透明的法律訴求。
算法的可專利性,是專利制度在算法解釋領域發揮作用的前提。算法是基于一定推理結構,并由各類數學函數表示的集合。由此立法一直貫徹“防止人工智能算法的可專利性”原則,并認為其與抽象方法、智力活動等一致,從而不具備專利授予的基本條件。近年來,學界一直呼吁給予算法專利,尤其是人工智能基礎算法的專利適格性。人工智能算法的可專利性是專利制度在算法解釋與透明功能中的起點,因此,本節將探討“是否可專利性”到“算法專利保護”的理論證成與制度轉變。
目前,中國正處于“防止算法專利適格性”逐步向“科學探尋算法專利適格標準”的法理轉化的過程中,首先需要厘清“防止算法專利適格性”理論基礎,才能有的放矢、推陳出新,建立“科學探尋算法專利適格標準”的理論體系。全世界范圍內對于算法專利的可專利擔憂主要出于三個方面。
其一,智力活動除外原則①。由于人工智能算法的技術抽象性與應用基礎性,容易被歸類為智力活動——人們進行思維、表達、判斷、記憶的規則和方法。而智力活動在中國、歐洲、美國②均不能獲得專利適格性[12]。算法從人腦思維到“躍然紙上”再到計算機實施的過程,本就是需要投入大量時間、精力、財力的研發過程,因此,將人工智能算法歸于智力活動在智能時代逐漸失去意義,更多是捍衛人腦思維自由高于專利壟斷的法律宣言[13]。
其二,區分基礎研究與實際應用原則。傳統上認為,人工智能算法開發作為計算機領域典型的基礎類研究,由于其缺乏直接商業應用性,不適用于專利制度進行保護與激勵,容易使專利覆蓋范圍過寬,難以平衡專利權人與社會公共利益[14]。
其三,技術應用領域限制原則。歐洲與中國將算法專利應用于具體技術領域,被視為可專利性的必要條件;美國則認為,技術領域含義模糊,并在“Bilsky 案”確立不采用“技術領域”標準[15];日本更是對此沒有要求,使得人工智能基礎算法得以在日本獲得專利[16],但隨著機械時代轉向信息時代,日本對技術性的認識也在逐漸發生變化;德國最高法院在“集成電路分層邏輯檢驗方法”的司法實踐中指出,對“傳統自然力”的直接應用不是具有“技術性”的必要前提,此外,德國對審查人員專業水平與現有算法專利數據檢索庫建設不健全等制度成本的考量,也是影響“技術應用領域限制”原則的因素。
應當綜合行業發展進行適當的法理調整,在肯定算法專利適格性的前提下,以發展的眼光看待“技術性”的范圍[17],并審視“應用于具體技術領域”的限定是否必要,從而平衡個人利益與社會公益,進而更加明晰算法專利的權利范圍。
其一,機械時代到信息時代的轉變,使得算法理論到程序應用的距離大幅縮短。算法專利審查標準轉變的現實依據是,信息時代使得數學基礎理論從原本使用機械類實現方式轉變為使用“計算機+大數據”的信息化實現方式。因此,在計算機領域,基礎理論與具體應用的界限逐漸模糊,許多算法由于軟硬件一體化設計,自始至終就是為實際應用而存在的,因而無法忽視其技術性。
其二,人工智能基礎算法可作為“信息系統中的組件”通過具體技術加工,選定具體技術方向,進入實際產業應用,無須與具體技術應用綁定③。在以復雜系統化計算機軟件、大型工業機械為產品應用的今天,一項產品從基礎研究到實際應用往往需要經歷多層技術、配件供應商等多個環節。所以,處在中間層的人工智能算法具備抽象思維與技術方案兼有的二元性特征,傳統機械工程領域的專利審查標準變化,為智能時代人工智能算法專利適格性判斷提供了應對變革的借鑒。例如,人們熟知的發動機配氣機構中的“可變節氣門技術”,其作為教科書中的典型基礎工程理論不可能授予專利。但是,各車廠以此理論結合工業設計、材料學、精密機加工等不同技術方案,設計出的功能相同但表現形式不同的配氣機構,卻能各自獲得專利,成為發動機模塊的重要組成部分。此外,上述專利也可以在航空發動機、發電機等一系列新領域進行應用,并不需要再次申請專利。相應地,人工智能算法中的抽象神經網絡理論無法獲得專利,但是一旦與計算機技術結合,通過數學函數表達—數據結構開發—計算機代碼實現等一系列技術開發,不同廠商會據此路徑開發出功能類似但表現形式不同的工程成果,并可能應用于多種場景。因此,現階段將人工智能算法視為智力活動,并要求與具體應用領域相結合才能獲得專利的二分法,實則與產業現狀脫節。因此,有必要結合產業實踐,借鑒“抽象層次法”[18],考慮在抽象思想與具體發明之間可能具有多重抽象層次,不再謀求絕對的“抽象思想—具體應用”二分法對立④。
綜上所述,人工智能基礎算法作為“中間產品”一開始就以應用為導向進行研發,且創新活躍、科技競爭力強。考慮到專利保護范圍與現實技術貢獻的“比例原則”,理應獲得專利適格性。
面向新一輪技術革命與市場需求,國家知識產權局發布了《關于修改〈專利審查指南〉的公告》(第343 號),并在2020 年 2 月施行的《專利審查指南》(以下簡稱“2020 年《指南》”)中,第一次將“人工智能算法”納入中國專利類法律文件。但是,對于算法專利依然存在整體論和與具體應用領域相結合兩大限制。其中,整體論(俗稱“三技術判斷法”),是指每一項發明的核心在于權利要求是否具有技術問題、技術手段、技術效果三要素的同時,以一個整體的視角判斷權利要求是否體現出“技術性”特征[19];而與具體應用領域相結合,是指人工智能算法必須通過適用于某一特殊領域,形成“人工智能算法+具體應用場景”的模式才能獲得可專利性。然而,人工智能算法專利的核心技術性并不在于算法應用領域的創新,以及技術問題、技術效果這類功能性描述。核心基礎算法的開發以及利用計算機進行算法訓練這一技術手段,才是核心科技競爭力⑤。
因此,2020 年《指南》在同年12 月就迎來了第二次修改。筆者認為,中國此次專利審查標準的修改較以往有了突破性進展。此次修改首先弱化了整體論中的“技術三要素”并確立了以“技術手段”為主的審查思路,同時明確了“利用計算機實施的各類人工智能算法”是技術手段的一種,此類判斷標準實際上更加接近專利審查的核心。以往的整體論審查技術三要素+與具體應用領域相結合,更注重審查標準的“形”,而非“實”。專利的適格性審查往往依賴審查員的“自由心證”與專利申請人的解釋答復來判斷。因為對于人工智能算法專利的審查,難點在于對適格性沒有清晰的判斷標準。整體論的出現實際上是適格性審查標準未明晰的妥協產物,任何一項創新被賦予專利都是由于其核心技術手段,而非“手段+問題+效果”的混同,技術效果、技術問題都只是輔助審查員理解技術的手段。另一關鍵改動是對“應用于具體領域”的程序后移,不再在適格性審查中進行判斷,而是后移至“創造性”的審查中。而此次意見稿也對技術手段(算法)與技術數據的關聯性作出了規定:要求算法每一個步驟所處理的數據皆為技術數據。并通過實施例的修改,使得“人工智能算法+技術數據”的組合可被認定為專利客體。因此,中國基本在審查標準上放開了對于人工智能基礎算法的專利適格限制,只要求其必須處理技術數據并且能夠在計算機上運行。
智能時代的算法治理著眼點在于如何有序地促進算法公開,其中就包括合理的政府審查、企業的自愿公開、適當的公開機制。專利制度作為科技與法律結合的代表,同時又以“公開換壟斷”為主旨,理應承擔企業通過私法自治,自愿利用合理公開機制進行算法解釋的任務,從而促進與政府的協同共治。這既能激勵創新,也能滿足公共監督的訴求。在明確算法理應獲得專利適格性后,下文將探討專利公開的具體內容能否滿足中國以《算法推薦規定》確立的算法解釋需求,并以法律對算法解釋的定性、定量、定體要求作為判斷標準。
算法解釋的關鍵在于利用自然語言的方式,通過公開算法的結構、數據流向、關鍵參數等方式,使具備一定專業素養的理性人能夠理解并認可其不含違法的價值判斷,從而滿足可能存在的政府審查、企業自律、個人申訴這三大場景的解釋需求。算法專利審查員與算法審查工作人員擁有類似的技術背景和法律訴求,通過審查員“自由心證”首先判斷算法是否違反國家法律與自然道德,這是一切專利的前置條件。以往大量的算法專利作為一個子模塊潛藏于方法專利中,而現階段單獨以算法為內容的專利公開,將會通過審查員第一步判斷其技術風險。為此,算法專利申請書將會盡可能地解釋算法的機制機理、模型、數據、應用實例等,以換取“信任”從而達到算法解釋的定性需求。
為了盡可能直觀地展示算法“主觀惡性”與技術指標之間的關系,筆者嘗試提出算法解釋定量的四個標準⑥。一是公平性。從社會角度出發,提供的解釋要具有保證模型決策公平的能力,使模型能夠進行道德分析,識別出模型中存在的偏見,此標準應當為算法解釋中的首要考量。二是可信任度。可信任度是指模型性能的置信度高,具有魯棒性和穩定性,并產生可靠的、可信的解釋,從而降低因技術不成熟造成無意侵權的可能[20]。三是可達性和交互性。可達性是指構建模型時,終端用戶能夠更多地參與到過程中;交互性是指終端用戶可以對模型施加影響,獲得一定的控制權。由于智能決策的終端受眾大部分是非計算機技術人員,該標準能夠給予個人視角下更多的算法透明信息,幫助其理解和參與智能決策模型的運作[21]。四是因果關系。當前的機器學習模型大多揭示了數據之間的相關關系而沒有揭示因果關系,但人們更希望看到因果性解釋而不是相關性解釋[22]。
首先,公平性是算法治理的最優法律價值訴求,具體又可以分為數據公平、設計公平、結果公平三類。數據公平主要是指數據質量的準確性和完整性,以及數據標注過程中不存在偏見歧視;設計公平包括模型是否試圖識別并避免任何潛在的偏見和歧視,是否對輸入的樣本特征采取了減少偏見的措施,是否在后續模型訓練、測試和評估階段通過調整參數或模型結構來減少可能存在的偏見;結果公平是指算法作出的決策對受決策主體而言沒有不公平的影響。僅就海內外公開的算法專利來看,由于算法專利說明書多為嚴肅的算法結構與數據流向介紹,不會出現顯示主觀道德判斷的內容,只有專業技術人員才能從中判斷出可能的道德風險。而訓練數據“權重值”的未公開[23],一方面是出于商業秘密考慮,另一方面在于權重值是動態調整的。
其次,可信度是算法的重要參數,是其運行與結果可靠性的重要指標,雖然不能直接體現算法的主觀惡性標準,但是與算法不成熟而導致的過失侵權相關。可信度還可以拆分為準確性與安全性:準確性是指模型實際輸出與設計輸出之間的比例,安全性則是系統免受破壞和確保重要數據、個人信息不泄露的能力。目前,各類主流算法專利都將能夠提升可信度的技術手段寫入權利要求中,并作為重要的創新點與功能性特征,顯然大部分專利公開文書是“不羞于”展示其算法可信度的。
再次,可達性和交互性的本意是使智能決策的終端用戶理解和參與智能決策模型的運作,此舉在技術上過于激進。不過在軟件工程中,技術人員在做單元與集成測試時,也會對交互性提出要求。人工智能算法的發展也是近年來才突飛猛進的,而將可解釋端口融入算法設計更屬于前沿理念。因此,即便面臨當下交互性在專利公開中的缺失,一旦未來可解釋性納入算法設計成為主流,相信更多算法專利也會將交互性模塊寫入專利申請書中。
最后,因果關系體現在目前算法專利公開中,呈現重數據相關性解釋、輕權重邏輯性解釋的現狀。例如:在推薦算法中,推薦結果與用戶特征、樣本推薦信息特征、信息瀏覽特征等相關;在基因判定算法中,輸入的DNA 序列與輸出的子位點預測、預測非編碼變異功能相對應。此類公開僅存在輸入輸出的相關性描述,無法準確進行邏輯解釋。畢竟算法專利以算法的邏輯決策為主要內容,涉及數據正義的解釋訴求都是專利公開難以滿足的。但是,算法透明度的分級分類,使得淺層的數據相關性公開也能滿足輕度算法透明的解釋需求[24]。再考慮到商業秘密與算法公開之間的平衡,法律不應要求專利公開承擔全部解釋任務,在適度公開的同時,為后續技術性的解釋報告提供快速落腳點,也是專利公開的算法解釋功能體現。
綜上可知,算法專利公開可以部分填平“主觀惡性”與技術指標之間的鴻溝,不過,未來經過系統的技術加工,并形成技術性的算法解釋報告才能更好地實現算法解釋的定量分析。但是,專利公開文件作為兼具法律性、技術性、文學性的復合體,同時具備技術正義、機制原理、解釋公告的功能,即便無法直接視為算法解釋報告,也依舊披露了部分原理與參數,可以成為算法解釋報告的基礎參考,是一種介于黑箱與白箱的中間態,并且較多部分的描述也能夠直接體現算法解釋的定量要求。
作為承載算法解釋功能的法定表現形式與必備內容,在算法解釋報告或其他國家、行業統一的算法公開紙質文書尚未形成的當下,算法專利公開文書成為現階段唯一針對算法公開的、具備法律效力的統一技術文書?!端惴ㄍ扑]規定》中第8 條和第12 條分別就算法公開作了內容與功能的定體要求。前者包括機制機理、模型、數據、應用結果等內容,后者為優化檢索、排序、推送等功能。可以采用可視化、實例、元素權重排序等形式,展示上述內容與功能,目的在于,通過最簡單明晰的方式,展示技術手段(算法)與技術效果(結果)之間的因果關系,檢驗是否存在法律風險。
因此,專利公開文書若能滿足上述內容、功能、形式要求,則可以判定達到了算法解釋的定體要求。首先,在內容上,《算法推薦規定》所要求的機制機理與模型結構是算法專利權利要求中的必備元素,尤其是人工智能基礎算法,會將模型結構以及每一層神經網絡性質、功能、相互關系、數據流向一一列明。相應地,數據與應用結果通常會出現在說明書與實施例中。算法訓練的數據類型(如人臉特征、行為標注等)、應用結果也是專利授予三標準⑦中“實用性”的關鍵考量,申請主體都會詳細列明其算法可實際應用的技術領域與預期結果。其次,在功能上,通過技術手段,解決技術問題,達到長久以來技術效果作為人工智能算法專利的審查重點。即便審查標準修改后,降低了技術效果的審查權重,但是觀察國內外算法專利的公開文件,除少量人工智能基礎算法的技術效果描述以抽象的技術提升為主⑧外,其他傳統算法專利的技術效果依舊以“檢索、排序、推送”等實際應用為主⑨。最后,在形式上,要分情況討論。一是以算法模型為主要內容的人工智能基礎算法,由于其專利公開內容幾乎只包括機制機理、模型、數據,因此無法也沒必要知曉其技術手段與技術效果之間的關系,由于缺乏具體的應用場景(技術效果),算法風險自然無從談起。二是傳統具備明確應用場景的算法,技術手段與技術效果的關系即為算法專利內容與功能的關系,二者的因果關系將是能否授予專利的核心標準。但是,因果關系的判定是由審查員通過每一技術特征綜合分析后得到的整體性判斷,難以在短時間內通過專利公開文件中的格式性段落得到快速的解釋,需要后續技術加工后形成明確的技術性評價才能體現出專利審查員的心證過程。并且,專利審查員會側重考察二者的關聯性是否緊密,不會著重于可能出現的法律風險,因此,也需要具備相似技術背景的監管人員從法律側依照現有的專利公開內容進行提煉,形成法律價值判斷[25]。
綜上可知,專利公開制度與算法解釋制度具備相似的法律價值追求,在內容、功能、形式上也存在大量重疊。但相較于學界呼吁的技術解釋報告,專利公開書在披露細節時還存在不足,同時二者也各有側重。其一,二者在算法內容、功能的公開方向上基本趨同,可以滿足算法解釋定體需求。雖然算法專利只能部分起到算法解釋的作用,但是在算法分級分類公開的背景下,部分算法僅通過專利公開便能夠滿足專利性要求,并且成為后續算法解釋不可缺少的參考基礎。同時,企業面對的算法解釋訴求也不盡相同,如果不需要提供嚴格的解釋報告,只需要在算法機理與“輸入—輸出”關系上做出簡要答復要求,則專利公開完全能夠滿足適度的算法透明訴求。其二,二者各有側重且制度定位不同。如果說算法專利申請書是通過明晰技術原理、體現技術效果來說服審查員認可其創造性,那么算法解釋則是通過可視化的方式簡化與明晰算法輸入與輸出因果關系,使擁有一定技術背景的理性人認可其不存在歧視與違法風險。二者可能形成“原材料”與“加工產品”的關系,從專利申請書到算法解釋報告,可以通過部門規章、行業標準等限定技術路徑形成算法解釋報告等專為算法透明而生的法律文本,最終滿足形式上的定體需求。算法的專利公開最終為監管主體提供了良好的基礎研究資料,從而有效降低監管成本,快速明確監管方向,做到有的放矢。
創新與穩定、效率與公平是法律在規制科技時所面臨的永恒矛盾,而平衡上述矛盾的主要方法就是每一級別的技術都有適應其“松緊度”的法律予以規制,從而將剛性矛盾轉化為多個柔性交互[26]。目前,算法技術主要以商業秘密、算法專利、開源社區三種狀態存在,對應完全封閉、半公開、完全公開的算法透明度。至于選擇何種存在方式,則完全由企業自主選擇。所以,如何科學地引導企業盡可能選擇后兩種方式,就在于最大化算法公開制度的算法解釋功能。
商業秘密由于其天然的非公開性,通常用于保護企業核心競爭力資產。人工智能基礎算法屬于行業內最底層的基礎技術,具備研發難度高、供應鏈話語權強等特征,使得國內企業都傾向利用商業秘密保護其算法技術。但是,《優化營商環境條例》提出“包容審慎監管原則”,對“有效監管”與“高效創新”提升治理能力提出了新要求。在此背景下,商業秘密無法像算法專利公開制度那樣,滿足企業合規與可持續創新的新時代要求。首先,在目前算法透明定成治理趨勢的當下,商業秘密與企業合規在一定程度上是矛盾的。因此,除最基礎的科研類算法創新外,一切有可能較易應用于實際且對產品用戶產生實際影響的算法創新都可能被納入算法審查的范圍[27]。其次,人工智能所屬的軟件工程學科與市場都非常注重生態建設,知識的共享與交流反倒更容易促進技術的進步,所以才會有大量科技公司在注冊算法專利的同時,甚至建立開源算法庫,供世界范圍內所有開發者與企業免費使用,從而有助于整體軟件生態的可持續性創新。畢竟軟件生態才是企業的顯性競爭力,強大的算法開發能力所帶來的溢出效應足以阻斷后發國家的算法自主開發道路。因此,以公開換壟斷甚至換信任,來促進企業自律,在有助于監管的同時,更為中國自主算法開發生態提供了良好基礎。最后,專利所構建的專利墻與開放算法所形成的生態壁壘逐漸成為科技公司博弈的新業態,二者的公開性使得各企業之間已經不完全以算法技術為競爭核心,數據才是真正的行業壁壘[28]。由于人工智能應用對于數據的高度依賴,無論是營商環境還是算法歧視,其法律風險實則源于“數據正義”而非算法黑箱。算法更多是一個連接“數據”與“用戶”的自動化決策執行器。無論是算法開發中的“訓練數據歧視”,還是應用后的“非正義數據輸入”,都將帶來侵害權益的“輸出結果”,更大的法律風險實際在數據端[29]。所以,固守工業時代商業秘密的思維既無益于合規建設,也無用于激勵創新。
基于構建算法治理體系的特殊性和復雜性,算法治理應進一步發展和完善已初見格局的政府監管、社會監督、公民維權、企業自治的多元共治體系,從而使專利公開成為政府主導、個人參與、企業自治法治模式中企業側的重要制度。以算法審計、算法透明度報告為代表的呼聲較高的治理路徑,都不可避免地會增加治理成本與企業抵觸心理。而專利公開與算法解釋有機結合,在降低治理成本的同時,其核心還在于激發企業活力。
算法創新是充分發揮數據及硬件資源之價值的關鍵前提,是智能社會運轉的基石,也是先進生產力的標志。西方以Google 為首的科技公司大量申請人工智能算法專利,一方面是凸顯其技術優勢,另一方面則是為后續可能專利競爭做儲備??紤]到目前中國大量科技公司在關鍵算法上依舊依賴進口,因此,當前中國亟須大力加強在基礎算法層面的核心技術創新,提高專利質量。據筆者走訪與調研發現,除少數大公司申請了算法類專利外,絕大多數科技類公司并未充分利用專利制度保障自己的研發成果,其中原因既有對專利適格性的擔憂,又有對算法審查的懼怕。在供給側結構性改革的大背景下,高技術附加值產品的創新需要基礎科研與應用創新的共同發展?;A科研的進步,主要依靠政府財政對高??蒲袉挝坏耐度?,應用技術的創新則更多依賴企業進行專利創新。通過公開換壟斷,實現基于其商業化后的利益保障,是企業創新的原動力。因此,人工智能基礎算法的可專利性,將進一步引導企業加大投入并申請專利,同時利用專利公開減輕企業面臨的監管壓力,最終達到利用專利公開破除算法黑箱的功能。但是,算法解釋是專利公開制度下的有益副產物,并不能完全代替企業自發公開說明、政府強制性監管等一系列專為算法透明而設的算法解釋制度。
算法規制的特殊性在于其黑箱性帶來的侵權風險既具備法律性也具備技術性,因此,其治理思路應當尋找法律與技術兼備的路徑。算法解釋作為以可解釋技術為基礎、合規評價為內容、特定文書為體裁的監管工具,其與現有專利制度的契合性,為算法解釋盡快落地提供了有利基礎。以審查員為核心的專利公開理念與算法解釋監管,追求使算法專利公開滿足算法解釋的定性要求;專利公開中的算法結構、實施例等與《算法推薦規定》要求披露的內容部分重合,從而在一定程度上能滿足算法解釋的定量要求;專利公開文書由于其面向用戶與功能定位的差異使得其難以直接代替算法解釋文書,但是依然具備基礎參考意義,因而可以部分滿足算法解釋的定體要求。綜上所述,如何科學地將專利公開文書與其他算法治理途徑相結合,實現政府治理壓力與企業合規壓力的雙減負,將是未來持續探討的方向。
注釋:
① 專利法上排除智力活動方法的理由主要包括:一是智力活動對物理世界不產生影響;二是人的智力活動具有不確定性,不具備產業上的可重復性;三是智力活動是基本的創新工具,對其授權將妨礙創新;四是不應限制人在頭腦中的思維自由。
② 美國雖在其《專利法》中未予以明文規定,但在司法實踐中“智力活動方法”原則在美國聯邦最高法院審理的軟件專利適格性第一案“Benson 案”中得以確定。即如果一項發明創造可以完全通過人腦執行完成,那么該發明創造就與智力活動方法同一,則不屬于可以授予專利權的對象。Douglas 大法官專門指出,涉訴專利申請中的數學過程“可以不使用計算機就被執行”,即意指其可涵蓋智力活動方法。
③ 信息技術產業的實踐中,已有大量通用算法通過商業或非商業的函數庫、構件庫、開源代碼、開放平臺等多種形式提供給他人。例如:谷歌的開源機器學習平臺TensorFlow 提供核心開源庫;阿里云人工智能平臺“機器學習PAI”、騰訊智能鈦機器學習平臺等均提供豐富的基礎智能算法組件,支持眾多具體領域的應用開發。人工智能是中國“新基建”的七大重點領域之一,可以通過集成先進算法的開源框架或開放平臺,對外提供公共普惠的人工智能相關產品及服務。
④ 騰訊研究發布的《人工智能:國家人工智能戰略行動抓手》,將人工智能技術按照“基礎設施—算法—技術方向—具體技術—行業解決方案”進行層次劃分。
⑤ 例如,原有卷積神經網絡默認輸入是圖像,可以把特定性質編碼寫入網絡結構,使前饋函數更加有效率,并減少了大量參數,對于大型圖像處理有出色表現。
⑥ 該標準參考了 2017 年7 月美國國防部高級研究計劃署(DARPA)啟動一項7 000 萬美元的可解釋性人工智能計劃。參見:參考文獻[9]。
⑦ 專利申請需要滿足“新穎性”“創造性”“實用性”三個標準。
⑧ 例如,所描述的方法可以使模型在不同網絡中的訓練時長更短。
⑨ 例如,只需要通過一個模型,就能夠同時對目標對象的關鍵點的位置信息和可見性信息進行識別,從而能夠降低資源占用率。