劉曦子
(賽迪智庫網絡空間研究所,北京 100846)
區塊鏈與人工智能技術是當前科技行業非常前沿的兩類技術。從技術本質上來看,區塊鏈技術本質上是通過共識算法來生成、存儲數據,通過智能合約操作數據,以及通過密碼學技術保證數據的安全[1]。區塊鏈技術具有去中心化、數據不可篡改等特點[2]。人工智能技術則包含三個關鍵點,一是數據,二是算法,三是計算能力。實際上,從這兩類技術本身特點來看,區塊鏈和人工智能在數據、算法和算力這三個層面上可以相互賦能并融合發展。
在數據層面,區塊鏈技術在一定程度上能夠保證可信數據,以及實現在保護數據隱私情況下的數據共享,為人工智能建模和應用提供高質量的數據,從而提高模型的精度。
在算法層面,一方面,區塊鏈的智能合約本質上是一段實現了某種算法的代碼,人工智能技術植入其中可以使得區塊鏈智能合約更加智能;另一方面,區塊鏈可以保證人工智能引擎的模型和結果不被篡改,降低模型遭到人為攻擊風險。
在計算能力層面,基于區塊鏈的人工智能可以實現去中心化的智能聯合建模,為用戶提供彈性的計算能力滿足其計算需求。
可靠的、高質量的數據是人工智能技術應用的重要基礎。然而,當前用于人工智能技術建模的數據收集和運用存在四個問題。
一是數據不可信。人工智能和大數據技術的發展促進了大數據交易市場的火爆,很多人工智能的互聯網公司由于自身缺乏數據收集渠道而轉向從數據交易市場的數據公司購買。實際上,市場很多的所謂大數據公司的數據來源來自于數據黑市,數據真實度和可信度大打折扣。例如,有些數據過期失效,數據販子對同一份過期數據稍加修改,反復售賣。數據販子甚至通過制造虛假數據獲取利潤,這些“臟數據”往往只有30%是真實的,70%是造假充量的假數據。
二是數據涉嫌非法。一部分數據販子通過所謂內部渠道,企業內部人員與外部人員勾結,以及其他關系掌握數據資源,其本身沒有數據加工能力,通過直接售賣裸數據賺取差價,在販賣的數據中,有些數據可能是涉嫌違法的個人隱私數據。
三是數據質量不高。例如,數據的實時性較低,數據標注質量不高等。在人工智能應用中,包括圖像識別、語音識別、動作識別、自動駕駛等領域都需要對數據進行精準標注,高質量的標注數據決定了人工智能建模的效率[3]。
四是數據難以共享。當前,數據產業仍處于垂直分割狀態,數據的持有者、開發者、使用者相對分離,數據難以流動和共享,無法最大程度利用數據為人工智能企業發展提供動能。即使不同企業或者組織之間有意愿進行數據共享,也因為涉及用戶數據隱私安全問題和數據共享中的利益分配問題望而卻步。

表1 物聯網應用層協議比較
區塊鏈以其可信任性、安全性和不可篡改性,能夠在保證數據可信、數據質量、數據隱私安全的前提下,充分實現數據共享和數據計算,為人工智能應用在數據質量和共享層面提供有力的支持。
首先,區塊鏈的不可篡改和可追溯性使得數據從采集、交易、流通,以及計算分析的每一步記錄都可以留存在區塊鏈上,任何人在區塊鏈網絡中,不能隨意篡改數據、修改數據和制造虛假數據,使得數據的可信性和質量得到一定程度的信用背書,有助于人工智能進行高質量的建模,從而使用戶獲得更好的用戶體驗。
其次,基于同態加密、零知識證明、差分隱私等技術實現多方數據共享中的數據隱私安全保護,使得多方數據所有者在不透露數據細節的前提下進行數據協同計算[4]。例如,IBM Watson Health(健康醫療項目)基于區塊鏈技術研發一種安全、高效、可擴展的醫療數據交易方式,實現患者隱私數據的共享,包括電子病歷、臨床實驗、基因數據以及移動設備、可穿戴設備和“物聯網”(IoT)設備中包含的醫療數據,以便IBM 通過分析大量的個人醫療數據進行建模從而推動相關基于人工智能技術的醫療診斷應用的落地。再次,基于區塊鏈的激勵機制和共識機制,極大拓展了數據獲取的來源渠道。在區塊鏈密碼學技術保證隱私安全的前提下,向全球范圍內所有參與區塊鏈網絡的參與者,基于預先約定的規則收集需要的數據。對于不符合預先規則的無效數據,通過共識機制予以排除。參與者授權使用的有效數據,以Hash碼形式記錄在區塊鏈上,個人通過公私鑰技術擁有數據的控制權;對于授權提供數據的參與者,提供Token等形式的激勵。
總的來說,區塊鏈能夠進一步規范數據的使用,精細化授權范圍,有助于突破信息孤島,實現保護數據隱私的前提下安全可靠的數據共享。人工智能基于可信和高質量的數據開展計算和建模,極大提升區塊鏈數據的價值和使用空間。
智能合約概念最早在1994年由學者 Nick Szabo 提出,最初被定義為一套以數字形式定義的承諾,包括合約參與方可以在上面執行這些承諾的協議,其設計初衷是希望通過將智能合約內置到物理實體來創造各種靈活可控的智能資產。
區塊鏈技術的出現重新定義了智能合約,并將智能合約的內涵進一步具體和深入。當前的智能合約一般是具有狀態、事件驅動和遵守一定協議標準,并運行在區塊鏈上的代碼程序。它能夠實現一定觸發條件下,以事件或者事務的方式,按著代碼規則,處理和操作區塊鏈數據,并由此控制和管理區塊鏈網絡的數字資產。作為一種嵌入式程序化合約,可以內置在任何區塊鏈數據、交易、有形或無形資產上,形成可編程控制的軟件定義的系統、市場和資產。
可以看到區塊鏈的智能合約的本質是代碼,和其他編程語言并沒有什么不同。通過智能合約的代碼可以自動處理區塊鏈網絡的不同節點之間的交易,例如為傳統金融資產的發行、交易和管理提供了自動化的工具。在數字票據的整個生命周期中,票據開立、流轉、貼現、轉貼現、再貼現、回購等一系列業務類型、交易規則和監管合規,都可以通過智能合約編程的方式實現。此外,智能合約也能夠應用于社會系統的合同管理、監管執法等事務中。
當然,智能合約只是一個事務處理模塊和狀態機構成的系統,它的存在只是為了讓一組復雜的、帶有觸發條件的數字化承諾能夠按照參與者的意志,正確執行。此外,智能合約在法律上并不具備法律約束力,在功能上也并不智能。在商業活動正真需要實際簽署合約的場景下,智能合約在實踐和理論上無法實現它名字所賦予的功能,智能合約代碼本身也缺乏真實合同的基本要素,例如條款、條件、爭議解決等[5]。智能合約在具有真正法律約束力上還有很長的路要走。不僅如此,智能合約的代碼也是僵化的、一成不變,在實際應用中缺乏必要的靈活性。實際上它只包含了基于不同輸入而反饋的一系列復雜結果,當前的智能合約并不智能,它的處理是確定性的。如果說它智能的話,僅僅體現在提供有效的自動化履約,降低人為錯誤和潛在爭議風險。
人工智能為區塊鏈中相對粗糙的智能合約技術帶來了福音,并有助于實現合約智能化。人工智能結合區塊鏈智能合約,以三個層面重塑全新的區塊鏈技術應用能力。
一是人工智能結合智能合約,可量化處理特定領域問題,使得智能合約具有一定的預測分析能力。例如在保險反欺詐應用中,基于人工智能建模技術構建風控模型,通過運營商的電話號碼不同排列的數據組合進行反欺詐預測,并依據智能合約的規則進行相應的處理?;谌斯ぶ悄艿闹悄芎霞s,能夠處理人腦無法預見的金融風險,在信用評級和風險定價方面比人腦更具有優勢。
二是人工智能的介入讓其擁有仿生思維性進化的能力。就智能合約本身而言,通過人工智能引擎,在圖形界面的模板和向導程序的指引下,能夠將用戶輸入轉化為復雜智能合約代碼,即生成符合用戶和商業場景的“智能協議”。
三是人工智能不斷地通過學習和應用實踐形成公共化的算力。
當然,人工智能與智能合約的深度結合還需跨過法律和技術兩重難關。盡管一些相對簡單的合約通??梢詫⒙募s自動化,對于更加復雜的合約,可能還需要人的介入來解決爭議。
在區塊鏈與人工智能結合的層面上,區塊鏈技術在一定程度上保證了數據可信和質量。人工智能技術通過引擎構建模型,并運行在區塊鏈上,使區塊鏈的智能合約更加“智能”。在算力層面,人工智能通?;趥€人自建或者傳統云計算平臺進行模型計算訓練。隨著數據量的增大和計算復雜度的提升,對于傳統中心化的云計算平臺和服務器的計算能力的要求也越來越高,對于企業的成本投入也在不斷攀升,這主要因為高性能計算機或者是服務所帶來硬件采購和維護成本。
盡管互聯網企業已經使用廉價的P C 機作為云平臺的服務器,但電力消耗依然巨大。共享經濟的到來,為降低能源消耗和提高資源利用效率提供極佳的解決思路。全球范圍內的大多數普通計算機的算力都處于閑置狀態,如果能夠把這部分算力利用起來,能夠極大降低人工智能建模的成本和提高資源利用效率。
區塊鏈是分布式網絡,能夠實現算力的去中心化。區塊鏈有助于構建去中心化的人工智能算力設施基礎平臺,轉變傳統的不斷提高設備的性能以提高算力的思路。
在算力層面上,區塊鏈技術可以實現在分布在全世界各地的去中心化海量節點之上運行人工智能神經網絡模型,利用全球節點的閑置計算資源進行計算,實現去中心化的智能計算。此外,通過區塊鏈智能合約可以根據用戶產品計算量對網絡計算節點進行動態調整,從而提供彈性的計算能力滿足用戶計算需求。
本文從數據、算法和算力三個層面對區塊鏈與人工智能技術融合發展進行了探討,可以看到區塊鏈與人工智能在數據、算法和算力層面可以相互賦能。隨著區塊鏈與人工智能技術成熟,以及學術界和產業界廣泛探討,相信未來區塊鏈與人工智能這兩種技術融合將更加深入,應用場景會更加豐富。