曹國忠,楊雯丹,劉新星
(1.河北工業大學機械工程學院,天津 300401;2.國家技術創新方法與實施工具工程技術研究中心,天津 300401;3.肇慶小鵬新能源投資有限公司,廣東肇慶 526060)
專利的技術信息具有新穎性、創造性和實用性的特點,且專利的表述專業、內容詳盡、格式規范,是開展技術分析和技術管理的重要技術資料。從專利中挖掘技術信息并予以有效管理和解讀,對專利的分析和利用具有重要意義。專利分析通常可分為結構化數據分析和非結構化數據分析。典型的專利結構化數據包括申請日、發明人、IPC 分類號、引用量和被引用量等,通過分析該類數據可獲知專利的價值、技術/產品的發展路徑和技術/產品的成熟度等[1-3]。專利的非結構化數據通常指專利的標題、摘要和說明書中的文本信息,分析該類數據所展示的技術信息是對結構化數據分析結果的有效補充[4]。近年來,專利對于企業的作用逐漸從保護知識產權擴展為技術信息的管理和應用[5],因此,專利的非結構化數據分析越來越受到學者們的重視。
專利的非結構化數據分析也稱為專利文本分析。由于專利的標題和摘要是專利全文的概括性表述,早期的專利文本分析主要集中于標題和摘要,此后隨著研究成果的應用推廣,人們要求專利分析應當做到更全面、更深入和更準確,因此專利文本分析的研究范圍逐漸向權利要求書和說明書延伸。依托文本挖掘和自然語言處理技術的發展,專利文本分析的研究對象也逐漸由關鍵字向語義傾斜[6]。目前,專利文本分析已被廣泛應用于人力資源管理、專利侵權判定、專利新穎性判定、技術機會識別和技術信息管理等。
基于主體-行為-客體,即Subject-Action-Object(SAO)三元結構的專利分析方法,是一種隨著專利語義分析需求而興起的專利分析工具,它不但能提取專利文本中的關鍵概念,輔助構建專利知識管理系統,還能更有效地挖掘專利知識用以輔助創新設計。近年來,人工智能方法和可視化工具的發展更是促進了基于SAO 結構的專利分析方法的發展和應用,基于SAO 結構的專利分析方法在知識獲取、科學研究等領域有著廣闊的應用前景[7-8]。本研究通過選取和分析中國知網(CNKI)和美國科學網(Web of Science)數據庫平臺中基于SAO 結構的專利分析方法的研究成果,總結了SAO 結構研究的主要內容和基于SAO 結構的專利分析流程,討論了基于SAO 結構的專利分析方法提高傳統專利分析方法全面性、深入性和準確性的主要研究成果,并對SAO 結構分析方法在專利情報分析、創新設計、專利知識管理系統和企業管理領域的應用進行了闡述,以期為如何應用基于SAO 結構的專利分析方法更好地服務于知識獲取和科學研究提供幫助。
Subject-Action-Object(SAO)結構是從文本語料庫中提取的三元組。其中,主體(Subject)S 元素和客體(Object)O 元素是名詞,行為(Action)A 元素是這些名詞的動作或表示它們之間的關系。SAO 結構研究的主要內容包括以下4 個方面:
一是對S 元素或O 元素的分析,即實體分析。例如,計算S 元素或O 元素在文本中出現的頻率,用來識別核心技術組件[9]。
二是對A 元素的分析,即關系分析。例如,通過表示系統組成類的動詞(如:有、包含等),可輔助構建產品形態結構[10];通過表示系統屬性類的動詞(如:測量、分解等),可獲取特定問題的解決方案[11]。
三是將SAO 結構作為一個整體分析其語義信息,即文本語義信息分析。例如,將S 元素和O 元素視為作用對象和被作用對象,則A 元素代表了S 元素的功能[12];將SA 組合視為產品的功能,則O 元素代表了產品功能的效應[12];將AO 組合視為問題,則S 元素代表了解決該問題的方案[13]。
四是研究不同SAO 結構之間的關系。例如,構建SAO 結構網絡,使用社會網絡分析技術分析領域中的通用技術、核心技術、新穎技術和技術成熟度等[14]。
基于SAO 結構的專利分析是指從專利文本中獲取和研究SAO 結構的過程,其通用流程如圖1 所示,包括數據預處理、SAO 結構提取、SAO 結構后處理和圖表解釋4 個主要步驟。
(1)數據預處理,包括將專利文本拆分為句子、將句子拆分為詞語(處理英文文本時不含該步驟)、將詞語詞干化(具體為將名詞的復數形式、動詞的過去式、過去分詞等轉化為原形,但處理中文文本是不含該步驟)、標記詞性等自然語言處理步驟,以及基于統計學原理的數據清洗步驟。
(2)SAO 結構提取,主要通過基于符號的方法或基于統計的方法實現。基于符號的 SAO 結構提取方法通常包含元素識別和關系構建兩個步驟[15]。其中,關系構建的任務是識別和抽取元素對之間的關系,是最核心、最具有挑戰的部分[16]。另一種基于統計的SAO 結構提取方法是指,使用統計模型或機器學習算法學習語言規則,進而匹配詞法、語法、語義等特征來提取SAO 結構[7]。目前,學者們多使 用Link Grammar、StanfordNLP、OpenNRE、Jieba等開源自然語言處理工具半自動化提取SAO 結構,或使用Goldfire Innovator、VantagePoint 等專利分析工具自動提取。為了提高SAO 結構在后續分析任務中的可用性,學者們也常將自動化方法、基于符號和基于統計的方法相結合[16]。
(3)SAO 結構后處理,主要是指對SAO 結構進行分類研究,以及繪制基于SAO 結構的專利圖表。該步驟依據專利分析的最終目的開展。
(4)圖表解釋,即是從上一步構建的專利圖表中獲取知識的過程。

圖1 基于SAO 結構的專利分析通用流程
首先,自然語言處理技術在專利分析中的應用改善了過去需要大量專家參與且費時費力的缺點,基于SAO 結構的專利分析方法作為一種自然語言處理技術與專利分析方法的融合產物,得到了學者們的廣泛關注。近年來,機器學習算法的推廣,更是提高了基于SAO 結構的專利分析方法處理大型語料庫的能力;此外,基于SAO 結構的專利分析方法不但關注文本中的主謂賓結構,還能研究復雜句式中的定狀補表等特殊成分[17-19]。因此,基于SAO 結構的專利分析方法相較于傳統專利分析方法,不再受到數據量的限制,在研究內容上也能覆蓋更多的文本信息,即提高了專利分析的全面性。其次,由于專利分析逐漸由線性向網絡化轉變,部分學者開展了專利網絡的研究[20]。傳統專利網絡多以專利文獻或專利權利人為節點,以文獻間的引用關系或作者合作關系為連接;SAO 結構的引入,使專利網絡的研究對象深入為文本的語義結構,為研究專利的隱性知識提供了一種新的思路。因此,基于SAO結構的專利分析方法相較于傳統專利分析方法,能夠解讀更加深刻的關系,即提高了專利分析的深入性。第三,專利分析不但需要全面、深入地認識和把握專利中的技術信息,還需要準確獲取和理解專利中的知識。相較于基于關鍵字的專利分析方法,基于SAO 結構的專利分析方法從句法關系角度研究專利信息,解讀的是關鍵字之間的語義關系;另外,基于SAO 結構的專利分析方法不但能提取到專利中的技術主題、技術應用領域、技術功能、技術功能達到的效果以及為達到效果可采用的方案等技術信息,還能解讀不同類別技術信息之間的內在關聯性。因此,基于SAO 結構的專利分析方法相較于傳統專利分析方法,能獲取專利信息中的核心概念,能解讀核心概念之間的邏輯,即提高了專利分析的準確性。表1 所示為基于SAO 結構的專利分析方法提高傳統專利分析方法全面性、深入性和準確性的主要研究成果。

表1 基于SAO 結構的專利分析方法主要研究成果

表1 (續)
隨著對專利分析方法全面性要求的提升,許多文獻的研究對象已由過去的專利標題和摘要擴展為專利權利要求書和說明書。基于SAO 結構的專利分析方法的出現,為提高專利分析方法的全面性提供了一個新的研究方向,即,從研究專利文本中的句法結構擴大到研究詞的覆蓋范圍。例如,溫亮等[17]使用基于SAO 結構的專利分析方法研究了復雜句式中狀語位置的名詞語塊,主要采用句子主干提取規則和復雜名詞語塊分解規則相結合的方式提取一個句子中的多個SAO 結構,具體步驟為:先使用句子主干提取規則提取一個句子中的主要A 元素,然后將句子中的狀語作為新的簡單句,再使用復雜名詞語塊分解規則分析介詞性名詞語塊、動詞性名詞語塊和連詞性名詞語塊,并提取SAO 結構。Kim 等[18]提出了一種SAOx 方法來提高專利分析方法的全面性,該方法提取了復雜句式中賓語位置的SAO 結構,同時還從復雜句式中“for”和“to”引導的短語中提取了SAO 結構。苗紅等[19]提出使用技術-關系-技術(TRT)結構分析方法與基于SAO 結構的專利分析方法相結合來提高專利分析方法的全面性,其中TRT 結構中的TR 組合相當于SAO 結構中的S 元素,TRT 結構中的T 元素相當于SAO 結構中的AO組合,TRT 結構通過Python 開發的NP-PP(名詞短語-介詞短語)模塊獲取。苗紅等[19]提出的方法中,TRT 結構分析方法與基于SAO 結構的專利分析方法互為補充,進一步補充了專利分析的詞覆蓋范圍。
專利網絡作為一種專利分析工具,由于引入了社會網絡分析技術,能將專利關系進行量化處理,得到了學者們的廣泛關注。SAO 結構的引入,使專利網絡的研究對象能夠深入為專利文本中的語義結構,據此構建的專利SAO 結構網絡能從網絡結構、節點位置和節點關系三方面研究更深層次的專利隱性知識,依托社會網絡分析技術的量化指標能解讀更加深刻的關系,進而增加了專利分析方法的深入性。一種常見的專利SAO 結構網絡構建和分析流程如下:(1)獲取專利文本中的S 元素、A 元素和O元素;(2)將S 元素和O 元素作為網絡的節點,A元素作為節點的連線,按元素的共現頻次繪制SAO結構網絡;(3)使用社會網絡分析技術分析網絡中的節點和連線。例如,Yoon 等[21]使用專利SAO 結構網絡的子網絡密度(density of sub-networks)研究了專利的分類,其中SAO 結構直觀表述了不同專利類別的技術特征;Yoon 等[21]還提出,SAO 結構網絡的節點度分布(degree sum index)和全局中心性(global centrality index)可以用來解讀專利的技術重要度和技術適用性。Choi 等[22]構建的專利SAO 結構網絡是一個加權有向網絡,主要用于識別技術趨勢,網絡中的節點由S 元素、A 元素和O 元素構成,節點間的連線由SAO 結構中的S 元素指向A 元素、指向O 元素,權重為直接指向在專利中出現的次數,認為在該網絡中:入度高的O 元素是極有可能成為對各個領域均有用的技術,或是某項技術績效的重要指標;出度高的S 元素是相關領域的一項通用技術;具有高密度和高群聚系數的SAO 結構是核心技術,或是一種少數研究團隊開發的技術;具有高密度和低群聚系數的SAO 結構是一項通用技術;具有低密度和高群聚系數的SAO 結構是一項核心技術,或是一種少數研究團隊開發的新穎技術。Yang 等[14]提出了一種基于SAO 結構的專利技術發展成熟度分析方法,使用該方法繪制了一組基于時間切片的專利SAO 結構網絡,通過觀察網絡節點度的概率分布在技術發展時間線上的變化,分析了專利技術發展的成熟度;他們還指出,SAO 結構網絡中節點的Burt 約束值(Burt constraint 值),即與更多的節點連接但是與它連接的節點沒有直接或相互關聯的現象,展示了節點的競爭優勢。
使用增加專利數據量和擴大專利文本研究詞覆蓋范圍的方法,可以有效避免專利分析中數據稀疏和部分核心內容可能丟失的情況,但同時也會帶來數據冗余的問題。為了提高SAO 結構在后續專利分析任務中的可用性,進而提高專利分析的準確性,學者們主要從優化SAO 結構提取方法和分類研究SAO 結構兩個方面開展研究。
4.3.1 優化SAO 結構提取方法
基于SAO 結構的專利分析方法相較于基于關鍵字的專利分析方法,還能夠獲取句法結構中的關系,而關鍵字和關鍵字間的句法關系又構成了文本的語義信息,因此,SAO 結構提取方法的性能成為了影響專利分析準確性的關鍵因素之一。
SAO 結構提取方法可分為基于符號的方法和基于統計的方法。在基于符號的SAO 結構提取方法方面,許琦等[23]提出使用專利結構化數據分析方法與基于符號的SAO 結構提取方法相結合的方式來提取SAO 結構,具體步驟為:(1)構建專利的引證網絡,并依據引證路徑的連接統計值(search path link count,SPLC)和節點對統計值(search path node pair,SPNP)提取領域知識進化軌跡;(2)使用Link Grammar 語法分析器從領域知識進化軌跡上的專利中提取SAO 結構。使用優化的SAO 結構提取方法提取的SAO 結構具有穩定性、統攝性、遺傳性和變異性的特征,是有效的領域知識基因。另外,依存句法分析(dependency parsing)由于主要研究句子中詞語之間的依存關系,能準確識別主謂賓、定狀補等句子成分,得到了學者們的重視[24-25]。借助依存句法關系,可利用句法分析器自動標注詞間關系,進而設定SAO 結構的提取規則。
在基于統計的SAO 結構提取方法方面,使用機器學習算法將文本信息做分類處理是一種最典型的做法,其中,機器學習算法與特征的選擇是影響SAO 結構提取性能的主要因素。例如,饒齊等[26]使用一種有指導的支持向量機(SVM)的機器學習算法,依據實體距離特征和句法樹特征提取了中文專利中的SAO 結構,實驗證明,引入距離特征和簡單的上下文詞法特征能有效提高SAO 結構中關系提取的準確性;何宇等[27]基于以上特征又加入了關系詞距核心關系詞的距離、SAO 結構強度和關系詞詞典等特征,提取了中文專利中的SAO 結構,實驗證明,優化特征后SAO 結構提取方法在正確率、召回率和F 值上都優于饒齊等[26]提出的方法。張永真等[28]則是使用了預測準確率高、速度較快、性能較好的XGBoost算法來優化關系提取方法的性能。近年來,面向自然語言處理的預訓練模型發展迅猛,且有效地提高了關系抽取任務挖掘出更多非線性語義特征的能力[16]。由此可知,深度學習的方法在基于SAO 結構的專利分析方法上的應用,將為提高專利分析的篇章理解能力提供新的思路。
4.3.2 分類研究SAO 結構
優化SAO 結構的提取方法屬于提高SAO 結構在下游任務中可用性的前置優化方法,分類研究SAO結構則屬于其后置優化方法。優化SAO 結構的提取方法能有效提高關鍵字及其關系提取的準確性,進而提高專利分析的準確性;而分類研究SAO 結構的方法則是從提高待解讀SAO 結構對下游特定任務和目標的針對性來提高專利分析的準確性。例如,Choi 等[29]使用分類研究SAO 結構的方法構建了一種由產品、技術和功能3 個維度構成的技術樹,將從專利中提取的S 元素和O 元素分為產品、技術、材料和技術特4 類,AO 組合分為組成、效果和屬性3 類;相較于傳統的技術樹,使用該方法構建的技術樹包含了更豐富、更詳細也更準確的技術信息,對于后續設計決策更具指導性。Vicente-Gomila 等[30]使用語義技術創新方法(TRIZ)和基于SAO 結構的專利分析方法相結合的方式,將專利中的技術信息分為了“what”“who”“where”“why”和“how”等5 類;這樣的分類同時考慮了技術與其周圍元素的關系,使專利分析的結果更具邏輯性。段慶峰等[31]為了能構建一種表達更準確技術信息的專利技術功效圖,將從專利中提取的SAO 結構依據其邏輯關系分為問題、功能、效果和方案4 類。Yang 等[9]為了識別具有巨大市場潛力的核心技術組件,開展了SAO 結構的分類研究,將包含“增加”“穩定”“質量”等元素的SAO 結構定義為“與需求具有高度相關性的SAO 結構”,據此提取的待解讀SAO 結構對于后續設計任務來說具有更強的指導性。
在當前數據驅動發展的形勢下,為決策者提供數據支持是專利分析的重要職責。基于SAO 結構的專利分析的主要應用領域包括專利情報分析、創新設計、專利知識管理系統和企業管理,其研究成果的應用領域分布如圖2 所示。
專利情報分析的結果主要應用于跟蹤科學研究領域的發展變化和預測前沿科學研究[8]。SAO 結構的引入,為傳統的基于非結構化數據或基于關鍵詞的專利情報分析補充了語義信息,能展示更詳細、更深入的技術信息。專利地圖,包括技術功效圖、技術路線圖、二維分布地圖和SAO 結構網絡等,是專利情報分析的主要分析模型。基于SAO 結構的專利分析在專利情報分析中的主要應用場景即是構建專利地圖。
例如,段慶峰等[31]提出的基于SAO 結構的專利分析方法主要用于構建技術功效圖,并由此得到石墨烯傳感器領域發展現狀和當前研究熱點。由于SAO 結構的引入,技術和功效之間的語義關系更易于理解和表達,因此能夠快速地從大量專利數據中抽取、分析和凝練出構建技術功效圖所需的專利核心技術信息。之后,翟東升等[25]對技術功效圖的構建方法進行了改進,并分析了無人駕駛汽車領域毫米波雷達技術的發展現狀和當前研究熱點。Wang等[32]提出的基于SAO 結構的專利分析方法主要用于構建技術路線圖,并通過分析使用該方法構建的染料敏化太陽能電池領域技術路線圖,揭示了該領域的發展趨勢、詳細實現途徑以及主要研究主體。該方法將專利文本中的技術信息分為技術、產品、材料、影響因素、組件、目標和未來應用方向等7 類,而這7 類技術信息之間的相互作用展示了技術的進化過程和發展方向。Yoon 等[33]和Park 等[34]提出的基于SAO 結構的專利分析方法主要用于構建專利的二維分布地圖,主要構建步驟如下:提取專利文本中的SAO 結構;使用SAO 結構的相似性構建專利的相似度矩陣;將相似矩陣做降維處理;繪制專利的二維分布地圖。Yoon 等[33]使用基于SAO 結構的專利分析方法構建了與碳納米管合成技術相關的專利二維分布地圖,提出地圖中的空白區域預示著可能創造新技術的機會,而專利聚集區域則代表技術發展最具競爭力的領域。另外,部分學者將專利情報分析的研究對象設定為一組基于時間切片的二維分析地圖,而基于SAO 結構的專利分析方法則主要用于構建這樣一組二維分布地圖,例如,使用這一方法,吳菲菲等[35]構建了一組與石墨烯傳感器技術相關的專利二維分布地圖,由此識別了該技術在不同時間區間內的應用領域,分析了該技術的跨領域轉移現象;王京安等[36]構建了一組與液晶材料技術相關的專利二維分布地圖,展示了該技術的發展進程和跨領域轉移現象;李欣等[37]則是構建了一組鈣鈦礦太陽能電池領域的專利二維分布圖,展示了該領域的發展脈絡并識別了領域內的新興技術。Yoon 等[21]提出的基于SAO 結構的專利分析方法主要用于構建SAO 結構網絡,構建了合成碳納米管領域的專利SAO 結構網絡,并通過該網絡識別了領域內的高價值專利、領先技術和技術領先企業;Choi等[22]構建了質子交換膜燃料電池領域的專利SAO結構網絡,并通過該網絡識別了領域內的重要技術主題和趨勢、重要發展目標,并進一步分析了領域內的催化劑技術以及識別了該技術中的重要材料;Yang 等[14]構建了石墨烯技術的專利SAO 結構網絡,并通過該網絡識別了該技術的當前和未來發展重點,及其在整體性能上具有明顯優勢的重要石墨烯材料,還通過分析一組基于時間切片的SAO 結構網絡的分布變化,分析了石墨烯技術的成熟度。
基于SAO 結構的專利分析方法用于輔助創新設計的構想最初由Tsourikov 等[38]提出,并成功實施于Invention Machine 公司開發的計算機輔助創新設計軟件Goldfire Innovator 中。該軟件提取用戶輸入問題中的AO 組合,然后將其與軟件后臺數據庫中的專利文本進行匹配,最后返回專利文本中表述為S元素的設計方案給用戶。基于SAO 結構的專利分析方法在創新設計領域的主要應用場景包括產品需求、結構和功能分析、技術系統進化分析以及設計概念推送等。
例如,Yang 等[9]提出了一種使用基于SAO 結構的專利分析方法識別產品市場需求的方法,該類市場需求在專利中表述為包含“增加”“穩定”“質量”等元素的SAO 結構。Wang 等[11]使用基于SAO結構的專利分析方法構建了一種新型的產品形態學矩陣,矩陣的橫軸由描述產品的零件、部件和組件的組成特征SAO 結構構成,縱軸由描述產品的技術問題的屬性特征SAO 結構構成,待研究專利則根據其包含的SAO 結構的種類和數量分布在該矩陣中,矩陣的空白區域代表可產生用于構建產品創新設計的方案。Cascini 等[10]使用基于SAO 結構的專利分析方法構建產品的功能模型,主要構建步驟如下:從專利附圖中識別產品的組件,作為S 元素和O 元素;依據專利附圖中組件的編號規則,識別S 元素和O 元素的層級關系;根據組件之間的組成關系或功能關系確定A 元素,并繪制產品的功能模型。另外,Cascini 等[10]還提出,可以使用基于SAO 結構的專利分析方法分析產品的組件和功能,用于輔助后續設計任務,如依據從專利文本中識別的S 元素和O元素的共現頻次,可分析產品組件的重要性,共現頻次越大的組件越重要;還可將專利文本中SAO 結構的共現頻次與其SA 組合、AO 組合的共現頻次作對比分析,如果SA 組合的共現頻次大于SAO 結構的共現頻次,表明該專利能達到的效果是“將S 元素所代表的工具的作用進行集成,以降低成本”,而如果AO 組合的共現頻次大于SAO 結構的共現頻次,則表明該專利能達到的效果是“增強A 元素所代表的動作”。Choi 等[29]使用基于SAO 結構的專利分析方法構建了一種由產品、技術和功能構成的三維技術樹,其中:以產品為中心的技術樹,展示了組件和組件之間的關系;以技術為中心的技術樹,展示了產品所包含的技術和技術之間的關系;以功能為中心的技術樹,展示了產品功能與功能之間的關系。這種新型的技術樹由于展示了更多的技術信息,故更利于輔助設計決策。Kim 等[12]使用基于SAO 結構的專利分析方法構建了一種新型功能網絡(cause-and-effect function network),由SAO 結構中的A 元素和O 元素依據其原因和效果關系連接而成,可將不同領域的技術信息相互連接,若使用由專利技術信息構成該功能網絡來編碼創新設計軟件的后臺數據庫,用戶可使用該軟件快速查詢功能或效應,輔助創新設計;另外,Kim 等[12]還提出基于SAO 結構的專利分析方法可與TRIZ 工具相結合來指導創新設計,具體做法為:將從與某項技術相關的專利文本中提取的S 元素、O 元素和AO 組合,分別與每條TRIZ 技術進化定律中的名詞和該定律中的每一次向前進化的驅動因素(reasons-for-jumps)做匹配,以此判定該技術當前所處的進化狀態并識別進化方向,進而輔助創新設計[39]。吳鴻韜等[40]提出將基于SAO 結構的專利分析方法用于為創新設計工程師推送設計概念。該方法通過引入SAO 結構分析方法,以創新設計為目的,從專利分析中獲取了更多樣的發明知識。其實現步驟為:使用SAO 結構分析方法從設計人員提供的設計原型專利中提取技術問題、用戶需求、功能目標、性能目標和實現原理等發明知識;將上一步中提取的發明知識與專利數據庫中文本做匹配計算,推送以AO 組合展示的設計概念,用以幫助設計人員明確設計需求;以設計概念為檢索條件,從專利數據庫中搜索并推送可用于輔助創新設計的專利文獻給用戶。
Invention Machine 公司開發的計算機輔助創新設計軟件Knowledgist,是最早的使用了基于SAO 結構的專利分析方法進行知識存儲、讀取和反饋的知識管理系統,其中基于SAO 結構的專利分析方法主要用來編碼專利知識管理系統中的發明知識。專利知識管理系統的主要功能包括專利分類、技術信息挖掘和展示以及發明知識推送等。
例如,胡正銀等[13]使用基于SAO 結構的專利分析方法開發了一款主要用于專利分類的專利知識管理系統,能夠幫助用戶快速發現領域中專利所采用的技術方案、解決的技術問題、實現的技術功能和取得的技術效果等信息,并能夠將專利依據以上技術信息進行分類展示。該系統使用SAO 結構進行專利技術信息編碼,擴展了傳統專利檢索系統的索引結構,細化了其檢索粒度。之后,胡正銀等[41]又基于該方法開發了一款專利技術信息挖掘系統,同樣使用SAO 結構編碼發明的關鍵技術知識,主要功能為面向TRIZ 的知識檢索和知識的可視化展示。Park 等[42]使用基于SAO 結構的專利分析方法開發了一款名為TechPerceptor 的專利知識管理系統,可以輸出基于SAO 結構的專利地圖和SAO 結構網絡,集成了Kim 等[12]面向情報研究的SAO 結構分析方法的研究成果,包括識別技術趨勢、識別重要專利、檢測新技術和識別可能的侵權等。Li 等[43]使用基于SAO 結構的專利分析方法開發了一款主要用于發明知識推送的專利知識管理系統,為了使系統能推送更豐富的解決方案給用戶,他們提出使用WordNet中的上位詞和下位詞擴展A 元素和O 元素,這樣,系統能夠在一個更豐富、更完整的專利集合中進行知識的搜索;此外,Li 等[44]還提出使用WordNet中詞與詞之間路徑的長度計算語義相似度的方法,將存儲在系統中的專利技術知識進行有效搜索和排序,進而提高解決方案的推送準確性。
基于SAO 結構的專利分析方法也被應用在了協助企業管理人員進行專利侵權判定、人力資源管理和組織實施戰略等企業管理工作。
例如,基于SAO 結構的專利分析方法通過分析專利間SAO 結構的相似性來判斷專利的相似度,進而評估專利侵權風險[45]。Park 等[34]依據SAO 結構相似性參數構建了專利群的語義相似度矩陣,并繪制了專利地圖,認為該地圖中具有較小平均距離(average distance)的專利群被認為是最可能發生侵權的區域;此外,Park 等[46]創造性地將該方法應用于識別專利與產品之間的侵權行為。Moehrle 等[47]主要使用基于SAO 結構的專利分析方法開展了人力資源管理工作,具體來說,他們將專利發明人的技術能力使用SAO 結構來描述,并依此構建了單個發明人的技術能力概要文件;同時,他們提出可以使用計算SAO 結構、AO 結構和S 元素的相似度的方法來識別具有相似技術能力的發明人群體,基于SAO 結構的專利分析方法還能用于為技術戰略決策者提供直觀指導。Yoon 等[33]使用基于SAO 結構的專利分析方法構建了專利申請人的研發趨勢圖(R&D trend map),清晰描述競爭對手之間的研發趨勢和技術重疊區域,為戰略決策者的專利購買、并購和合作等決策提供指導。Park 等[48]使用基于SAO 結構的專利分析方法輔助并購決策,具體做法為:從相關領域企業的專利中識別與并購戰略目緊密相關的技術領域;分析以上技術領域中的專利,將這些專利的所屬企業按技術水平、內部技術能力和潛在技術協同作用進行分類;依據不同企業,采取不同的并購策略。Wang 等[49]使用基于SAO 結構的專利分析方法識別和選擇潛在研發合作伙伴,使用各企業的專利數據,基于S 元素構建了企業技術合作網絡(organization correlation map),其中S 元素代表各企業擁有的技術解決方案,網絡中的節點為專利的申請人,節點大小表示解決特定問題的方案的數量,節點之間連線的粗細代表企業技術相似性的高低。該網絡有效衡量了每個研究目標,即企業,在技術上的相似性,為企業組織實施戰略提供了有益指導。

圖2 基于SAO 結構的專利分析方法應用領域分布
本研究針對國內外基于SAO 結構的專利分析相關研究成果進行了系統的綜述,研究發現:
(1)SAO 結構的研究主要包括SAO 結構中3個元素的獨立研究、SAO 結構中3 個元素的兩兩組合研究,以及多個SAO 結構之間的相互關系研究。這些研究豐富了SAO 結構的內涵,為其進一步發展和應用奠定了基礎。
(2)基于SAO 結構的專利分析流程主要分為數據預處理、SAO 結構提取、SAO 結構后處理和圖表解釋4 個階段。其中,數據預處理主要包括自然語言處理和數據清洗2 個步驟;SAO 結構提取主要包括元素識別和關系構建2 個步驟;SAO 結構后處理主要包括信息篩選和圖表構建2 個步驟。
(3)基于SAO 結構的專利分析方法主要從擴大研究詞覆蓋范圍來提高專利分析方法的全面性,從構建和分析SAO 結構網絡來提高專利分析方法的深入性,從優化SAO 結構提取方法和分類研究SAO結構來提高專利分析方法的準確性。這些研究展示了基于SAO 結構的專利分析方法的先進性,但其優勢仍有進一步提升的空間。
(4)基于SAO 結構的專利分析方法在專利情報分析領域主要用于跟蹤科學研究領域的發展變化以及預測前沿科學研究;在創新設計領域的主要應用場景包括產品的需求、結構和功能分析,以及設計概念推送;在專利知識管理系統中的主要作用是專利分類、技術信息挖掘和展示以及發明知識推送;在企業管理領域主要用來幫助企業管理知識產權和組織實施戰略。這些研究證實了基于SAO 結構的專利分析方法有著廣闊的應用前景。
基于以上系統梳理,本研究認為,未來可以在以下兩個方面進一步開展研究:(1)探尋更高效的SAO 結構提取方法。目前,基于機器學習的方法是最具發展前景的工具之一,且自然語言處理更是被視為人工智能“皇冠上的明珠”。因此,未來可通過對本體、資源描述框架(RDF)和語法樹等語義資源的研究,降低提取SAO 結構中非分類關系的難度,同時開發專利語料庫和領域語料庫,用以實現對SAO 結構的精準提取。(2)將基于SAO 結構的專利分析方法應用于更具體的企業技術創新管理實踐。由于企業之間的競爭在某種意義上來說就是專利技術的競爭,因此更精準、快速地分析競爭對手專利將成為提升企業市場競爭力的法寶。未來可使用基于SAO 結構的專利分析方法識別市場關鍵問題和領域顛覆性技術,用于向企業推送具有顛覆市場潛力的突破性創新或破壞性創新機會。