辛繼賓,吳利俊,陽 昕,王 曼
復旦大學圖書館(上海 200433)
區塊鏈(blockchain)作為一個分布式賬本技術,需經多方共同維護,并通過密碼學確保數據傳輸和訪問的安全性,使數據的存儲一致性、不易篡改性、防止抵賴性等得到保證[1]。醫療健康信息領域的數據處理是當前區塊鏈研究的熱點領域之一。中國信息通信研究院發布的《區塊鏈白皮書2019》認為區塊鏈在醫療健康信息領域的應用場景主要包括對患者既往病史數據的獲取、利用數據建立模型并用于醫學圖像資料的檢索和調閱、輔助醫生參與健康相關咨詢和疾病治療等方面[2]。鑒于專利文獻涵蓋全球最新發明創造信息的90%以上,已有學者從專利文獻角度對區塊鏈技術進行分析與研究。王玲等利用專利地圖分析方法,對國內區塊鏈領域主要研發投入機構進行研究[3]。苑朋彬等分析了全球范圍內區塊鏈技術主要研發機構、分布區域、技術領域和研發前景等[4]。雷孝平等采用文獻計量學方法分析了全球區塊鏈技術的基礎研究及專利技術創新研發現狀[5]。劉星等基于專利分析角度,對比了中美兩國在區塊鏈技術領域的競爭形勢,分別總結出兩國在該領域的關鍵技術,提出中國區塊鏈技術的機會與挑戰[6]。但目前尚無研究聚焦醫療健康信息領域區塊鏈技術研發現狀,本文基于專利分析視角,系統梳理國內外醫療健康信息領域區塊鏈技術研究現狀,為相關研究提供參考。
本研究數據來源為法國Questel公司開發的全球專利數據庫Orbit(https://orbit.com/),該數據庫收錄了包括中國知識產權局(SIPO)、世界知識產權組織(WIPO)、歐洲專利局(EPO)、美國專利商標局(USPTO)等在內的99個國家和地區專利機構的專利數據、24個國家和地區專利機構的全文專利信息以及14個國家和地區專利機構的外觀設計專利數據。
在Orbit專利庫的Fampat數據庫中,以區塊鏈技術相關關鍵詞作為檢索要素,輔以國際專利分類號(IPC:G16H+,醫療保健信息學,即專門用于處置或處理醫療或健康數據的信息和通信技術),并選擇從主要的申請人和發明人以及同義詞、近義詞擴展等角度進行補充檢索。因2009年1月產生的比特幣是區塊鏈技術的首個相對完整應用,故限定申請日起止時間為2009年1月1日至2020年9月17日。檢索式為(區塊鏈 OR blockchain OR數字時間戳OR digital timestamp OR創世區塊OR genesis block OR分布式賬簿OR distributed ledger OR去中心化OR decentralized OR去信任OR trustless)/TI/AB/CLMS AND (G16H+) /IPC。
本研究在分析前對檢索獲得的機構名稱、人員、關鍵詞等字段進行規范化清洗,以保證結果的準確性。社會網絡分析是衡量作為節點的社會行動者之間的關系集合,具體包括中心性分析、網絡密度、凝聚子群分析、核心-邊緣分析[7]。中心性是度量個體在整個網絡中所處中心化程度的重要指標,點度中心度是中心性的其中一個常用網絡中心度,它體現的是整個網絡中的某個節點和其它節點之間的相關性。節點的絕對點度中心度和相對點度中心度的數值越大,表明該節點在網絡中的重要性越高[8]。國際專利分類(IPC分類)是一種國際通用的專利文獻分類體系,由于一件專利可以同時包含一個或多個IPC分類號,針對那些同時含有兩個或以上IPC分類組號的專利,通過對其所屬IPC大組出現頻次進行統計分析,將這些數據轉換成共現矩陣,并利用社會網絡分析法對IPC大組進行共現分析。本研究以Excel、Python等軟件進行清理、分析和可視化展示,并主要利用社會網絡分析和可視化工具軟件UCINET繪制IPC共現網絡關系圖,揭示該領域的不同技術分支和研究熱點。
共獲得全球范圍內醫療健康信息領域區塊鏈技術發明專利樣本數據1 927條,其中有效專利1 660件(86.1%),因撤銷、過期和放棄的失效專利267件(13.9%)。2009年區塊鏈在醫療健康信息領域的申請量僅為34件,2010年出現第一個增長拐點,2011年呈小幅上升后,在2012年至2015年間發展平穩,2015年出現第二個快速上升的拐點,自2016年起進入快速增長期,僅2018年一年申請量就達到451件(圖1)。

圖1 醫療健康信息領域區塊鏈專利申請趨勢Figure 1.Trend of blockchain patent applications in the field of medical and health information
對技術生命周期的判斷,是以專利的申請量為橫坐標、專利申請人的數量為縱坐標作圖,反映隨著時間的變化兩者間呈現的發展趨勢,也稱技術生命周期圖法[9]。醫療健康信息領域區塊鏈技術生命周期與專利申請趨勢較為一致,2009年至2014年是技術萌芽期,2015年出現拐點,專利申請人和申請量逐年上升,進入技術快速成長期(圖2)。

圖2 醫療健康信息領域區塊鏈技術生命周期Figure 2.Life cycle of blockchain technology in the field of medical and health information
2.2.1 技術公開國家或組織分布
樣本專利數量排名前5的國家或組織機構分別是中國、美國、世界知識產權組織、日本和歐洲專利局,專利總量為1 522件,占所統計的樣本專利總量的79.0%。中國排名第1,專利數量為615件。各國或組織比較關注經由專利合作條約(Patent Cooperation Treaty,PCT)申請國際專利,如世界知識產權組織公開專利數量為209件,占樣本專利總量的10.8%,位居專利公開排名的第3位。擁有50件專利以上的國家還有韓國、加拿大、澳大利亞和印度,其余國家或組織專利總量均低于30件(圖3)。

圖3 醫療健康信息領域區塊鏈專利申請公開國家或組織Figure 3.Countries or institutions of blockchain patent application in the field of medical and health information
2.2.2 技術來源國家或組織分布
擁有超過20件及以上專利優先權的國家或組織在全球布局狀態如圖4所示。美國排名第1,擁有1 031件專利優先權,除在本國申請429件專利外,還在全球進行了全面的專利布局,并重視通過PCT途徑申請專利(149件)。中國排名第2,擁有565件專利,除在美國、日本、澳大利亞等海外地區申請40件專利外,其余525件專利均布局在國內市場。德國排名第3,擁有專利優先權數量90件,PCT專利申請9件。

圖4 醫療健康信息領域區塊鏈技術優先權國家或組織專利布局Figure 4.Patent layout of blockchain technology priority countries or organizations in the field of medical and health information
醫療健康信息領域區塊鏈專利申請數量排名前10的機構如表1所示,美國、中國機構各4家,德國、以色列機構各1家。美國進入全球前5名的機構有3家,包含專利申請量最高的加州大學以及DEKA PRODUCTS、ENLITIC兩家企業。中國排名靠前的機構分別為香港中文大學、平安科技有限公司、泰康保險集團股份有限公司、騰訊科技有限公司。

表1 醫療健康信息領域區塊鏈專利申請的主要專利權人Table 1.Main patentees of blockchain patent application in the field of medical and health information
目前全球醫療健康信息領域區塊鏈專利數量排名前10的IPC技術大組及釋義主要集中于5個IPC技術小類,分別為G16H(醫療保健信息學,即專門用于處置或處理醫療或健康數據的信息和通信技術)、G06F(電數字數據處理)、H04L(數字信息的傳輸)、G06Q(專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法)、A61B(診斷;外科;鑒定)。具體到IPC技術 大 組,G16H-010、G16H-050、G06F-021是專利申請量最多的3個技術大組領域,為該技術研究熱門方向。此外,根據世界知識產權組織發布的專利IPC分類和相應的技術領域對照關系,區塊鏈技術在醫療健康領域應用的相關研究主要集中在以下2個技術領域:①電氣工程部:如數字通訊(H04L)、計算機技術(G06F)、信息技術管理辦法(G06Q);②儀器部:如醫療技術(G16H、A61B)[10],見表2。

表2 醫療健康信息領域區塊鏈專利數量排名前10的IPC大組注釋表Table 2.IPC group notes of top 10 blockchain patents in the field of medical and health information
對納入的1 927件樣本專利進行清理分析,發現1 887件樣本專利中83.0%的數據含有有效的IPC大組數據,即1 567件樣本專利同時包含不止一個IPC大組數據。對1 887件樣本專利所屬IPC大組進行共現網絡可視化分析,結果提示IPC大組間合作關系密切,對IPC共現次數超過15次以上的數據繪制合作網絡圖,共有44個IPC大組,即圖中顯示的44個節點。其中,每個節點的大小按照節點的點度中心度值排列展示,具體如圖5所示。

圖5 醫療健康信息領域區塊鏈專利的IPC大組共現網絡Figure 5.IPC co-occurrence network of blockchain patents in the field of medical and health information
進一步對樣本專利的IPC大組點度中心度進行計算,按照數值大小從高到低依次排列,得到點度中心度排名前10的樣本專利所屬IPC大組列表(表3)。專利申請量排名前5位的IPC技術大組中,除了G06F-019,其他4位點度中心度均較高,G16H-010在兩組中均排名第1。但是點度中心度較高的2個技術領域(G06K-009、G06F-003)專利申請量尚未進入前10位。

表3 醫療健康信息領域區塊鏈專利IPC大組共現網絡點度中心度排名前10情況Table 3.Top 10 of the co-occurrence network centrality of the IPC group of blockchain patents in the field of medical and health information
區塊鏈技術以塊-鏈結構對數據進行存儲,能夠以較低的成本建立信任的新型計算范式和協作模式,逐漸在醫療健康信息領域建立起自己的應用場景和運行規則,成為該領域的研究熱點。本研究通過對醫療健康信息領域內全球區塊鏈專利數據進行分析,發現目前該領域的專利申請趨勢、技術生命周期均處于快速成長期。對樣本專利的技術公開國家或組織進行分析,顯示排名靠前的國家對待區塊鏈技術均是秉持積極支持的政策。如中國在2016年發布的《“十三五”國家信息化規劃》中,已將區塊鏈技術視為重點關注的一項前沿和熱點技術,為了在新時代的信息技術領域中占有先機,明確提出要強化包括區塊鏈在內的一些新興技術方向的開拓與創新[11]。
本研究結果顯示醫療健康信息領域內各個公開國家或組織的區塊鏈專利技術主要來源于本國或組織,提示各國普遍對其國內市場的保護意識較強。通過專利布局策略,積極在國內和國際醫療領域區塊鏈市場進行相應部署,但各自政策又有所不同。例如,美國各個機構的專利布局廣泛,不僅在本土申請了區塊鏈相關專利,還在他國也申請了同族專利,并積極開展全球布局,德國也在全球多個國家或區域均有布局,英國和日本在專利數量有限的情況下,較注重PCT專利申請。相比之下,中國、韓國、印度等國則主要以國內布局為主,提示與美、德等科技強國相比,中國在全球的專利布局相對薄弱,可能與國家的整體科技實力和醫療資源投入程度等相關。由于區塊鏈技術是底層技術,醫療健康信息領域是一個重要的應用層面,中國機構需有較強的海外布局意識,只有通過自主創新和知識產權保護相結合,才能提高在領域內的核心競爭力[12-14]。
本研究還發現該領域內主要技術研發機構多為企業,全球排名前10的機構中企業占比80%。其大都圍繞利用區塊鏈底層技術為電子病歷系統、生物傳感器數據處理、醫學影像識別與診斷、血液參數動態監測、實時動態臨床解決方案支持、給藥及配送系統、藥物研發、健康管理、風險管理、電子處方、生物技術、傳染病溯源等應用場景提供解決方案[15-17]。排名靠前機構的專利申請數量差距并不大,還包括一些創新企業,如美國ENLITIC、以色列CATHWORKS等,反映區塊鏈技術尚缺主導性企業,給相關機構提供了發展機會[18]。進一步對中美兩國專利數量和授權率比較,發現美國專利數量排名更加靠前,且在該領域起步較早,專利授權率更高(27.2% vs.9.2%)。
此外,區塊鏈技術在醫療健康信息領域內的應用已涉及多個技術領域分類,如醫療保健信息學、電數字數據處理、數字信息的傳輸、診斷與鑒定、酶或核酸以及微生物的測定或檢驗方法。從社會網絡分析層面看,目前合作程度較高的技術領域與前期專利申請量較大的技術分類之間存在差異,數據識別與數據表示、記錄載體及其處理、傳輸裝置等技術點是未來潛在的專利布局點,具有巨大的發展潛能,需要進一步加強多個技術領域的合作。
綜上所述,本研究從醫療健康信息領域區塊鏈專利技術的總體申請態勢、技術生命周期、技術研發區域分布、技術研發機構分布、IPC技術研發重點領域分布以及基于社會網絡分析的IPC大組共現分析等多角度進行討論,提示應把握該技術快速發展時機,提升相關機構全球布局意識,促進國內企業加快研發步伐,推動多個技術領域的合作。