文庭孝 李 俊
(中南大學信息安全與大數據研究院 長沙 410083)
專利文獻和專利信息是人類智慧的結晶,是人類開拓創新的智慧源泉。據統計,世界上平均每10秒鐘就產生一份專利申請,每20秒鐘就出版一份專利文獻,世界各國每年出版的專利文獻總量超過150萬件,占世界每年各種圖書期刊總出版量的1/4,全球專利文獻累積量已超過1億件,電子化、數字化、網絡化專利文獻數量更是難以勝數。如歐洲專利局的Worldwide數據庫收藏了1836年迄今的專利文獻8 000多萬件,數量還在不斷得快速增長[1]。
專利文獻既是技術文本,也是法律文本,集技術信息、法律信息、經濟信息和戰略信息等為一體。專利法律信息是專利信息的重要組成部分,在專利技術保護、專利質量把握、專利價值評估、專利技術成熟度判定、專利侵權糾紛解決以及專利技術研發、專利技術引進、專利產品銷售等方面發揮著重要的作用。
自1780年美國正式頒布專利法以來,隨著各國專利授權與保護制度的逐步建立與完善,專利申請與維權等實踐活動日益增多,相關研究成果也日益豐碩。與此同時,專利法律信息挖掘相關研究成果也廣泛分布于專利檢索、專利分析、專利地圖、專利文本挖掘、專利數據挖掘和專利引文分析等研究中[2]。整體來看,國內外有關專利技術信息挖掘的相關研究成果較多,而有關專利法律信息挖掘的相關研究成果相對較少。
專利文獻是法律文件,公開專利技術的權利歸屬,明確記載專利技術的保護范圍及專利權人的姓名、地址、申請日期等各項法律信息[1],反映專利的有效性、地域性,如專利申請、專利授權、申請駁回、申請視撤、專利權恢復等法律狀態信息[3],是了解專利權內容、范圍和有效性等法律狀況的有效信息源。
專利文獻中的法律信息是表示專利權的各種標志,這些標志包括技術信息(如發明名稱、摘要、權利要求書、說明書全文、附圖、關鍵詞、專利分類號、范疇分類、檢索范圍、引文等)、時間信息(如申請日、公開日、公告日、優先權日等)、空間信息(地址、郵政編碼、國家代碼、優先權國家、地區代碼、國省代碼等)、權利信息(如專利權人、法律狀態、權利要求書、申請號、公開號、公告號、專利號、優先權號、申請日、授權日等)、人員信息(如申請人、發明人、專利權人、專利代理人、審查員等)、專利族信息(同族專利數量、同族專利號、同族專利國家或地區等)等[1,4],從中可以提煉、挖掘、分析出相關的專利法律信息。
專利文獻中的專利信息一般分為外部(或外表)信息和內部(內容)信息兩個維度,專利法律信息包含在專利信息的兩個維度中。外部信息主要包括專利文獻首頁,即扉頁中的著錄信息;內部信息主要包括專利文摘、權利要求項和技術說明書三個部分中的專利信息[5]。具體來說,表示外部或外表信息的專利文獻特征項主要有文獻號、專利號、文獻類別、國家代碼、申請號、申請日期、優先申請號、優先申請日期、優先申請國家、公布或出版日期、展出日期(未審批)、展出日期(未批準)、公開說明書出版日期、審查未批說明書出版日期、批準專利說明書出版日期、申請人、發明人、受讓人、律師或代理人等。表示內容或內部信息的專利文獻特征項主要有國際專利分類號、本國專利分類號、國際十進制分類號、發明名稱、關鍵詞、文摘、引用文獻、專利權項、技術說明書、附圖等[6]。
專利具有時間性、地域性、權利獨占性等顯著特點,構成了專利法律信息的基本內容[7]。專利具有公開(或申請)、授權和失效三種基本法律狀態[8]。其中公開(或申請)包括專利申請、駁回、撤回、視為撤回以及實質審查、復審、著錄項變更等專利法律信息,授權包括專利授權、專利權轉讓、許可、強制許可、轉移、恢復等專利法律信息,失效包括專利權的視為放棄(未及時繳納年費)、撤銷、終止(專利保護期屆滿)、無效宣告等專利法律信息[9-10]。這些法律信息體現在專利文獻的著錄項目以及專利審查部門在專利審查過程中產生的各種專利文件中,為專利實施法律保護提供了可靠的法律依據。
專利文獻既是技術文本,也是法律文本,技術說明書和權利要求書是核心部分。專利說明書扉頁和權利要求書是專利法律信息最重要、最有效的信息來源。專利說明書扉頁揭示了專利的基本法律狀態信息,而權利要求書清楚、簡要地表述了專利技術請求保護的范圍,經審查授權后可以作為判斷是否侵權的法律依據,也是確定產品生產國,或準備輸出和引進時不致造成侵權的法律依據[11]。同時,也可以為專利申請審查、專利糾紛處理、專利技術引進等提供法律依據[1,4,10]。
基于專利分析的專利法律信息挖掘是指專利法律信息分析,即對專利法律信息進行整理、歸納、分析,對相關專利的法律狀態有個全面、清晰的了解,有利于根據專利的法律狀態規避法律風險,挖掘失效專利、尋找商機,判斷專利技術的質量和價值[9]。
專利分析涉及專利技術層面、經濟層面、法律層面(權利層面)和競爭層面(戰略層面)的分析[12]。法律層面或權利層面的分析,即專利法律信息分析,主要包括專利法律狀態分析、專利權利要求分析、專利侵權訴訟分析、專利權利歸屬分析和專利價值分析等。也有學者認為專利法律信息分析包括專利性分析、專利法律狀態分析、專利侵權分析和同族專利分析四個方面[1]。
專利分析也稱專利信息分析、專利情報分析、專利統計分析、專利計量分析,是指對來自專利文獻中大量或個別的專利信息進行加工及組合,并利用統計方法或數據處理手段使這些信息具有縱覽全局及預測的功能,并通過專利分析使它們由普通的專利信息上升為企業經濟活動中有價值的專利情報[12-13]。專利分析主要是從專利文獻中抽取大量的專利信息,利用定性、定量方法和專利圖表挖掘隱藏在專利文獻背后的情報,揭示技術、對手、市場、研發、人才、伙伴、法律等專利信息,幫助企業了解對手、了解市場、指導研發、找到專利人才、找到合作伙伴、得到公知公用技術、制定專利戰略、避免專利侵權、應對專利訴訟等[14]。專利分析可將專利信息轉化成具有較高技術與商業價值的專利情報[4]。
專利分析的本質是對專利著錄信息、文本內容、專利引文、專利數量等進行定向選擇和科學抽象,分析其相互關聯,挖掘深藏在其中的客觀事實真相,并轉化為有價值的專利競爭情報[11,15]。專利分析涉及管理學、法學、經濟學、自然科學等多個學科領域, 屬于交叉研究領域[15]。
專利分析方法根據性質一般分為定性分析、定量分析及定性定量分析(擬定量分析)方法三種[4]。定性分析是指通過對專利的“質”、專利文獻的內在特征和內容進行歸納、總結、分析與綜合等思維加工,達到認識專利本質、揭示內在規律的目的,一般用于獲取技術動向、企業動向、特定權利狀況等信息。定量分析利用統計學和文獻計量學等各種方法和手段,以數學模型和圖表為表達方式,對其中所含的各種情報要素進行統計排序、對比分析和研究,從不同的角度研究專利文獻中所記錄的技術、法律和經濟信息,從而揭示專利情報流的深層動態特征,了解技術、經濟發展的過去及現狀,并據此進行技術評估和技術預測[4,16]。具體的專利分析方法很多,都可以對專利分類號、專利發明人、專利權人、專利申請日(授權公布日)、專利申請國和專利法律狀態等相關法律信息進行定性和定量分析。
專利法律狀態信息的類型多樣,一般按專利生存情況分為“有效”和“失效”兩類,其中有效和失效又分為多樣類型。中國發明專利按審查情況可分為“公開”“實質審查”“有權”“失效”四類[13]。專利法律狀態分析的內容有特征點分析(分析單個專利對象中的法律狀態構成特征,結合商業、技術、政策,以及其他專利統計信息等剖析特征點出現的原因)和比較分析(運用“自身縱向比較”和“自身比他人”的方法比較不同法律狀態的構成差異,結合商業、技術、政策,以及其他專利統計信息等剖析差異出現的原因,進行合理推測)[13]。
專利法律狀態分析還可以利用專利指標來分析[4],如專利授權率(專利授權量與專利申請量之比,用于從整體上測算專利申請的技術質量)、專利存活率(專利存活量與專利申請量之比,用于測算法律狀態處于有效狀態的專利占比情況)。
通過對不同對象的專利法律狀態構成進行分析,可以衡量競爭對手的技術研發實力和專利技術含量高低,評估專利威脅;可以衡量技術領域的專利活躍程度,評估專利風險[17]。張運鴻、張善杰以德溫特專利數據庫為基礎,對我國的微電子機械系統傳感器專利技術的專利法律狀態信息進行了分析[18]。王偉基于德溫特專利數據對我國光纖預制棒領域的專利法律狀態的分布及趨勢進行了分析[19]。
專利權利要求書是確定專利保護范圍的主要依據,是專利申請文件中最核心的部分之一。專利權利要求數通常被用來研究專利的保護效果,一般認為,專利權利要求數越多,保護范圍越大,越容易被替代,保護效果越低[20-21]。
專利權利要求包括產品權利要求和方法權利要求。權利要求中記載的所有技術特征共同限定了該權利要求的保護范圍。權利要求分析從所涉及的技術內容(如創新點、保護范圍)、結構以及布局模式等方面進行,包括權利要求保護的主題、權利要求之間引用關系等[11]。
根據需求不同,專利權利要求分析包括保護范圍分析、侵權對比分析、撰寫缺陷分析、穩定性分析等[13]。從分析對象來看,權利要求的保護范圍分析包括“單件專利的保護范圍分析”和“多件專利的保護范圍分析”。多件專利的保護范圍分析又包括同一專利申請人的多件專利保護范圍分析和不同專利申請人的多件專利保護范圍分析。從分析內容來看,權利要求的保護范圍分析包括“權利要求書的結構分析”(分析權利所包含的技術特征及多項權利要求之間的關系,確定整個專利權利要求書所覆蓋的直接范圍)和“權利要求書保護范圍影響因素分析”(分析說明書中的技術方案如何在權利要求書中體現,以及專利和同族專利在審查過程中的相關文件是否對權利要求保護范圍進行限制與縮小)。權利要求保護范圍分析有助于找出權利和技術的空白點,不但可以了解技術自由實施度,設計專利侵權風險的合理規避方案,而且可以為新技術專利申請規劃權利空間,以保證順利獲得授權并得到最大的經濟利益。權利要求書保護范圍的影響因素分析有助于評估專利的穩定性,為后續可能發生的無效申請或侵權訴訟提供參考[13]。
我國《專利法》規定:未經專利權人許可,實施其專利,即侵犯其專利權。專利權的保護范圍以專利權利要求書為界限。專利侵權判定是專利訴訟、新產品開發、產品進出口貿易、技術規避設計等技術、經濟與法律活動中需要解決的重要問題。當事人和其他訴訟參與人在面臨專利訴訟時都需要進行專利法律狀態檢索與分析、專利侵權檢索與分析[1]。
專利法律信息分析的重點在于專利性分析、專利侵權和專利訴訟分析等,其共同點在于對專利權利要求本身的解讀和分析。專利性分析是指通過定性分析,判斷創新技術與現有技術相比較是否具備了專利法規定的新穎性、創造性和實用性。專利侵權分析側重于對已經發生或可能發生的專利侵權行為的判定,既包括企業對他人的侵權,也包括他人對企業的侵權。專利侵權分析也可分為防止侵權分析和被動侵權分析[13]。可以為已經發生或可能發生的企業的專利侵權行為做出恰當的評估,為企業采取規避或警告、索賠或賠償、訴訟及結盟等策略提供建議[10]。專利訴訟分析包括專利侵權訴訟主體分析、專利侵權訴訟可能性分析、專利侵權訴訟戰略分析[13]。
專利侵權分析和專利訴訟分析可以幫助厘清行業內不同訴訟主體的實際訴訟模式和應訴經驗、訴訟主體在不同地域面對和進行的專利訴訟情況。通過分析企業已經發生的專利訴訟或者許可談判事項,可以透視企業的專利申請、專利運用、專利布局和專利保護策略及研發方向、研發合作和企業兼并乃至整體專利戰略等信息,幫助企業對有可能發生的專利訴訟提前做好準備,為公司制定科學合理的應對策略提供參考。還可以達到阻斷競爭對手進入目標市場、獲得侵權賠償、消耗對方公司資源、獲取對方情報、詆毀對方商業信譽、獲得專利許可費用、影響下游客戶訂單等目的[4,13]。
專利權(Patent Rights)是指國家專利主管部門依據專利法授予發明創造人或專利權人在法律規定的有效期內,對其發明所享有的專有權、壟斷權、獨占權,未經專利權人許可,他人不得隨意使用該專利技術。專利權是一種專有的、排他的權利,但受到時間和空間的限制。
在專利權的獲取、運用過程中形成的關于權利狀態信息則構成了權屬信息,包括專利法律狀態、權利要求范圍(包括權利要求內容和要求保護的地域)、專利權的所有者等。專利權屬分析有專利法律狀態確認、避免侵權專利分析、可專利性分析和被訴侵權專利分析等[22]。
專利價值包括技術價值、經濟價值和法律價值三個部分,專利的法律價值分析是專利價值評估重要組成部分,一般用專利的穩定性、可規避性、依賴性、專利侵權可判定性、有效期、多國申請(同族專利數)、專利許可狀態等作為專利法律價值的衡量指標[23]。也有學者提出用專利被引次數、專利族大小、專利壽命、專利異議和專利訴訟等指標綜合評價和分析專利的價值,其中多個指標都與專利的法律價值密切相關[24]。根據專利壽命和專利族大小能更準確地反映專利的價值。歐洲、德國的專利法在專利授權后的一定期限內設置了專利異議,能夠成功抵御異議的專利可以認為是有價值的專利[25]。專利權要求數通常也是考察專利價值的重要指標。研究表明,有價值的專利表現為專利權要求的數量多而且技術覆蓋范圍廣,遭遇侵權和訴訟的頻率也較高[26]。一般認為,價值高的專利遭遇訴訟的可能性較大,因此,是否遭遇并成功通過專利訴訟是專利價值的重要反映,遭遇訴訟的可能性與專利權要求的數量呈正相關。此外,專利權要求的數量還可以用來表征專利的技術覆蓋范圍[25]。
基于專利檢索的專利法律信息挖掘主要是指專利法律信息檢索,專利法律信息檢索的類型主要有同族專利檢索、專利法律狀態檢索、專利性檢索、專利侵權檢索、專利查新檢索、專利訴訟案例檢索等。專利法律信息檢索在專利權轉移或許可、規避侵權風險、發生侵權糾紛、判定發明專利性等方面具有重要的作用[10]。
專利檢索是專利信息挖掘和分析的前提和基礎,其中專利法律信息檢索異常重要。專利檢索即專利信息查找,是指在專利信息源中查找所需信息或文獻的過程,具體包括專利性檢索、專題檢索、技術引進專利檢索、研發立項專利檢索、申請人檢索、發明人檢索、防止侵權檢索、被動侵權檢索(無效專利檢索)、專利有效性檢索、專利地域效力檢索、同族專利檢索(專利號、申請號、優先權)、專利引文檢索、失效專利檢索、專利訴訟案例檢索、專利語義檢索、外觀設計檢索等[1]。專利檢索利用專利著錄信息,通過專利文獻標引,提供多種檢索途徑和檢索入口,可以揭示專利申請(專利)號、申請日、公開(公告)號、公開(公告)日、專利名稱、專利摘要、主分類號、分類號、申請(專利權)人、發明(設計)人、主權項、地址、專利代理機構、專利代理人、優先權、國省代碼等專利信息,達到專利信息挖掘的目的[1]。因此,專利檢索是對已經加工存儲的專利法律信息進行挖掘和分析,一般可通過專利檢索系統、專利檢索平臺或專利數據庫來實現。各國專利局網站、商業數據庫和專利搜索引擎等中都有多個字段與專利法律信息密切相關,包括專利權人、專利號、專利發明人、專利申請年、專利優先年等。如基于網絡的 Innography 系統具有豐富的數據模塊和多樣的檢索分析功能,可以查詢和獲取 70 多個國家的同族專利、法律狀態和專利全文并進行深度分析。其中專利相似指標可幫助用戶快速查找相似專利,并應用到專利的無效分析、侵權分析等領域[27]。因此,有學者認為,可以通過檢索過期專利信息和專利法律狀態信息及利用失效專利數據庫挖掘免費專利資源[28]。
同族專利信息是重要的專利法律信息。專利文獻在產生過程中會大量重復出現,形成了一組組由不同國家出版的、內容相同或基本相同的、具有共同優先權的專利文獻。由至少一個優先權聯系的一組專利文獻,稱一個專利族,同一專利族中每件專利文獻被稱為專利族成員。同族專利檢索是指以某一專利或專利申請為線索,查找與其同屬于一個專利族的所有成員的過程。同族專利檢索可以通過同族專利檢索線索,即同族專利檢索要素來實現,同族專利檢索要素有號碼、公司 /人名和主題詞三類[1,7,10]。
專利法律狀態是指在某一特定時間,某項專利申請或授權專利在某一國家的權利維持、權利范圍、權利類型、權利歸屬等狀態,這些狀態直接影響到專利權的存在與否以及專利權利范圍的大小。此外,專利法律狀態還包括專利權歸屬、專利權是否有效、獲得許可證等專利產生、發展和變化過程中出現的其他法律信息[7]。
在專利產生、發展和變化過程中出現常見的專利法律狀態類型有:專利申請尚未授權、專利申請撤回、專利申請被駁回、專利權有效、專利權終止、專利權轉移、專利權有效期屆滿、專利權無效、專利權質押、專利許可、專利權視為放棄等。一般可通過各國的專利法律狀態檢索系統來實現[1,7]。
專利法律狀態檢索是指對一項專利或專利申請當前所處的法律狀態進行的檢索,其目的是了解專利申請是否授權,授權專利是否有效,專利權人是否變更,以及與專利法律狀態相關的信息[1,7,10]。專利法律狀態檢索包括專利有效性檢索、專利地域性檢索和專利變更信息檢索[9]。專利有效性檢索是指對一項專利或專利申請當前所處的法律狀態進行的檢索,目的是了解該項專利申請是否被授權,授權專利是否有效(如時間上是否處于有效期)。專利地域性檢索是指對一項發明創造都在哪些國家和地區申請了專利所進行的檢索,目的是確定該項專利申請的地域范圍(如同族專利檢索)。可檢索的其他專利法律狀態信息還有:專利或專利申請的著錄事項、變更信息、專利申請、審查或復審過程中的信息、授權后的專利權轉移、許可、異議等法律活動信息。
專利侵權檢索分為主動侵權檢索和被動侵權檢索。主動侵權檢索又稱防止侵權檢索,是指為了避免發生專利糾紛而主動針對某一產品或方法進行專利檢索,找出其可能侵權的專利或專利申請并且評估侵權風險,也稱為“自由實施(Freedom To Operate, FTO)專利檢索”。被動侵權檢索是指被別人指控侵權時進行的檢索,判斷專利侵權指控是否成立,找出對受到侵害的專利提出無效訴訟的依據。專利侵權檢索主要應用于產品制造、產品上市、專利訴訟、防范他人侵權等方面[1]。專利侵權檢索也稱為專利侵權判定及對比文獻檢索,其目的是為了規避專利侵權及用于被控侵權抗辯[29]。我國學者翟東升構建中文專利侵權檢索模型,并設計了中文專利侵權檢索系統,用于自動判斷中文專利權利要求書中的專利侵權行為[30]。
在專利法律信息檢索中,專利查新檢索也稱專利性檢索和新穎性檢索,是指找出與發明創造技術主題相關的現有技術中的對比文獻,或者找出抵觸申請文獻和防止重復授權的文獻,并與發明創造技術主題進行對比,判斷發明創造是否具有新穎性和創造性(可專利性)的檢索過程[1]。用戶在解決評估發明創造能否授權、確認授權專利的穩定性、幫助修改申請文件等問題時,以及在專利申請、專利審查和專利訴訟等過程中都需要進行專利查新檢索。
失效專利是一種失去專利獨占權的公開技術信息。失效專利是龐大的、免費的專利信息資源。部分失效專利失效后仍是該領域的重要技術,仍然可以創造巨大的經濟價值[1]。“失效”是指法律上的含義,針對的是專利權及專利申請權,即失去了法律保護的專利。對專利所包含的法律性、技術性、市場性而言,失效專利只是不再受專利法保護。
失效專利有狹義和廣義之分,狹義的失效專利泛指因法律規定的各種原因而失去專利權、不再受到專利法律保護的專利,即失去專利權的專利。廣義的失效專利是指專利文獻公開的技術不享有本國的專利權的專利,既包括失去專利權的專利,也包括失去專利申請權的專利,即專利文獻公開的技術屬于不享有或不再享有專利權的發明創造。也有人認為,因專利權的地域性失去法律保護的專利也屬于失效專利。因此,最廣義的失效專利是指“公開且不受保護”或“公開且失去權利”的專利[1,31]。
專利失效的原因有四種:申請階段失效(包括申請撤回或放棄、申請被視為撤回、申請被駁回等)、授權階段失效(包括專利權人未按規定繳納專利維持費、專利權人以書面申請放棄專利權,專利權的無效及撤銷等)、時效性失效(專利保護期屆滿)和地域性失效(未在法定期限內就相同主題的發明創造在某國或某地區提出專利申請,無法受到該國家或地區法律保護)[1]。也有學者認為專利失效有五大成因:保護屆滿、喪失專利權(未按規定繳納專利維持費、放棄專利權、專利撤銷及宣告無效、專利權終止)、專利申請未獲授權(專利申請被駁回、撤回、視為撤回、放棄)、未在中國申請的國外專利(喪失在華專利權)、未向知識產權局提出專利申請的發明創造[31]。
失效專利檢索也稱為專利無效檢索。專利無效檢索是通過檢索專利文獻、非專利文獻發現破壞該授權專利新穎性、創造性的過程,目的是找出與某一專利權要求相關的專利,通過這些專利使該權利要求無效,甚至使整個專利無效[22]。當專利審查員為判斷某一項申請的專利是否可以取得專利權時,需要調查過去是否有類似的專利已經被授權,這種搜索也被稱為專利無效性檢索[31]。失效專利可以通過專利(申請)號檢索、專利法律狀態檢索、時域檢索、地域檢索和申請人檢索等方式在各類專利數據庫和各國專利局網站進行檢索[1]。
專利訴訟案例是指各國與專利相關的司法判決和行政決定,如各國法院的專利侵權訴訟判決,我國復審委員會的專利無效宣告和專利復審。無論是大陸法系還是普通法系國家,都有大量的專利訴訟案例,可以為專利訴訟代理律師迅速鎖定商業高風險的潛在客戶,為盡職調查提供充分的數據和資料,對所代理案件有影響的相關各方進行分析和評估,并更有效地提出主張和辯護;為專利法官處理同類案件和提高自身專業素養提供極佳的研究素材和資料;為專利代理人、專利教學研究人員和學生學習與研究專利實務提供良好的實務素材[1]。專利訴訟案例可以通過各國法院網站、商業專利數據庫中的專利訴訟信息、綜合類法律數據庫和主要國家復審委員會判例數據庫等進行檢索[1,10,22]。
進入21世紀,隨著專利數據的不斷增長,越來越多的研究開始轉向如何快速并且準確地檢索出所需要的專利[32]。2002年,日本國立情報學研究所在第三屆NTCIR會議開始舉辦了針對日語和英文跨語言專利檢索研討會,該會議對專利無效性檢索、專利跨語言檢索等研究方向起到很大的促進作用[33]。
專利地圖(Patent Map,PM)是20世紀60年代為打破歐美等國技術壁壘、保護日本企業利益,日本特許廳(Japan Patent Office,JPO)首先研發的專利信息分析工具[34]。專利地圖是對專利情報分析結果的一種可視化表達[4]。世界知識產權組織(WIPO)指出,專利地圖也稱為技術路線圖(Technology Road Map),是對專利分析全部結果的可視化表達,通過對目標技術領域相關專利信息進行搜集、處理和分析,使復雜多樣的專利情報得到方便有效的理解[35]。有學者認為,專利地圖是專利信息圖形化處理、系統管理專利數據、協助制定專利戰略的方法,具體是指將專利情報的技術內容,用關鍵詞等數據化處理后進行加工分析,或者將各種專利著錄項用數據形式分類、整理,將其結果以圖表形式一目了然地加以表現[36-37]。也有學者認為,專利地圖是指對大量的專利文獻進行分析整理,特別是針對專利信息中的著錄特征項(專利申請號、授權號、專利名稱、發明人、國家、地區、時間、專利類型、IPC分類號等)和專利專有的權利信息進行統計分析,將結果組合繪圖,繪制出符合要求的、一目了然的圖表,通過圖表輔助專利戰略的理論和方法[38-40]。專利地圖基于聚類(Clustering)、整合(Aggregation)等方式進行數據化處理,將專利文獻在管理、技術、法律、經濟中的價值提取出來。因此,專利地圖制作涉及文本挖掘(Text datamining)、數據挖掘(Data mining)、引文分析(Citation analysis)等技術[6]。
專利地圖一般分為專利技術地圖、專利管理地圖和專利權利地圖三種,將三種不同類型的專利地圖結合起來,可對專利文獻經濟、技術、法律信息進行全面挖掘[4]。其中專利權利地圖(Patent Claim Map)又稱為專利范圍地圖,是將專利權利要求作為主要分析對象,制作已有技術專利的權利范圍地圖,揭示權利要求內容、范圍、權利轉讓、侵權可能性、權利狀態等法律信息。專利權利地圖有專利法律狀態解析圖(明確專利權人、專利有效性)、專利范圍構成要件圖和專利范圍要點圖、同族專利圖、專利引用族譜圖等[41-42]。專利權利地圖可以起到確認專利技術保護范圍、考察專利獲取的可能性、了解專利保護地域范圍、確定專利權期限、了解侵權可能、調研和檢索異議無效專利文獻等作用,從而幫助用戶識別可能的技術侵權、制定避免侵權策略、準確應對法律訴訟等[39-42]。
專利地圖的本質是對專利信息進行可視化(圖表)揭示和展示。專利地圖可以有效地揭示市場、競合、技術、研發、投資、法律、政策和戰略等綜合專利信息,可以幫助企業制定專利戰略,了解國內外技術動態、發現和開發空白技術、了解專利技術發展趨勢、研究核心技術和關鍵技術點、掌握競爭公司和發明人、避免專利侵權和專利訴訟等[43]。專利地圖的類型不同,在專利信息挖掘中的作用也會不同,將不同類型的專利地圖有機結合起來,可對專利文獻中蘊含的技術、經濟、法律和戰略等專利信息進行深度、全面地挖掘和剖析。其中,專利權利地圖就是對專利法律信息進行可視化(圖表)挖掘、揭示和展示。Hyunseok Park等利用SAO技術對公司的專利侵權現象進行了分析,并制作了相似專利地圖[44]。
專利挖掘,也稱為專利內容挖掘、專利信息挖掘、專利文本挖掘、專利數據挖掘等,是指在創意設計、技術研發、產品開發、技術貿易、專利訴訟等活動中,對所取得的專利技術成果從技術、法律、經濟和戰略層面進行剖析、整理、拆分和篩選,從而發現和獲得有價值的專利信息的過程,其核心是專利技術信息、法律信息、經濟信息和戰略信息挖掘[7,11,13]。專利挖掘的對象主要是專利文本和專利內容,專利挖掘一般分為專利文本挖掘(也稱專利內容挖掘)和專利數據挖掘(也稱專利信息挖掘)兩類。包括專利名稱、摘要、權利要求書、專利說明書等內容所蘊涵的專利信息[45]。
專利挖掘有助于從主題和內容角度對專利文獻、數據庫和互聯網中包含的技術特征(術語、關鍵詞等)和法律信息(權利要求等)及其組合形成的衍生經濟信息(專利價值、同族專利等)和戰略信息(專利布局、技術趨勢等)等進行深層次分析,以測度專利文獻間的相似性,發現技術特征關聯、演變和規律等,從而有助于企業從宏觀層面把握技術發展趨勢,從微觀角度把握技術創新細節,輔助企業技術創新決策[11]。因此,專利挖掘可以起到梳理技術創新成果、提升專利申請質量、提前規避專利風險、發掘未來競爭優勢等作用。在專利法律信息挖掘中,專利挖掘可用于專利侵權規避、反侵權識別和專利訴訟應對等方面。
文本挖掘是一個新興的研究領域,1995 年, Feldman等人將數據挖掘技術運用于非結構化數據——文本上,首次提出了文本挖掘的概念[46]。
文本挖掘,也稱為文本數據挖掘或文本知識發現,是指為了發現知識,從大規模文本庫中抽取隱含的、以前未知的、潛在有用的模式的過程[47]。目前文本挖掘研究主要圍繞文本挖掘模型、文本特征抽取與文本表示模型、模式發現(如關聯規則抽取、文本分類、文本聚類)等方面展開[48],并且文本挖掘技術已被應用于專利分析方面[30,49-50]。
專利文本挖掘是指使用文本挖掘的方法對專利文獻中富含文本內容的題名、摘要和權利要求等字段進行研究,得到在專利術語、分類和聚類等方面的研究結果[51]。專利文獻中包含著專利申請號、申請人、申請日、發明人、分類號等結構化信息和專利摘要、技術背景及權力要求等非結構化文本信息,蘊涵了重要技術細節和技術保護等內容,人工閱讀和分析這些文本信息十分耗時費力。如何從這些非結構化文本中抽取潛在信息、揭示技術的細節及其相互關聯關系、挖掘暗含的商業趨勢、啟發工業技術創新、輔助決策制定等,成為當前專利挖掘與分析領域的研究熱點[52]。文本挖掘技術可以批量處理大量文本數據,從中提取有用的信息,從而發現潛在的知識或模式,文本挖掘技術成為專利挖掘的重要應用領域[53]。專利法律信息也自然成為文本挖掘的重要對象和內容。
數據挖掘是采用數學、統計、人工智能和機器學習等領域的科學方法,從大量的、不完全的、有噪聲的、模糊的和隨機的數據中,提取或發現隱含的、預先未知的并且具有潛在應用價值的模式和知識,并應用于預測以指導決策的過程[30,47]。自20世紀80年代以來,為了解決“數據豐富,知識貧乏”的困境,數據庫知識發現(Knowledge Discovery in Database,KDD)和數據挖掘技術獲得了巨大成功并得到持續發展[47]。數據挖掘技術的發展為專利分析提供了有力的技術支持,目前數據挖掘技術已被廣泛用于專利分析領域,包括專利文獻評估、專利文獻自動分類、專利文獻推薦、專利技術預測和專利技術可視化等[54]。
21 世紀初,美國學者 Porter 等基于歷史科技文獻分析開辟了技術挖掘(Tech Mining)這一領域,挖掘對象包括學術論文和專利文獻等;挖掘內容不僅包括題名、作者、專利權人、專利發明人等外部著錄信息,還包括文摘、全文、專利權利要求等內容信息;挖掘方法包括統計分析、知識抽取、文本挖掘、語義分析、聚類和關聯分析、數據可視化等[5,55-56]。Yang、Lucy Akers等人開發了一種新的數據挖掘工具用于挖掘專利信息中隱藏的知識[57]。
專利數據挖掘使用數據挖掘方法直接處理專利元數據,得到專利共引或共類統計、時間序列和網絡拓撲結構等方面的研究結果[51]。應用數據挖掘技術開展專利信息挖掘的目的是搜集、分析特定技術或產品的專利情報,掌握該專利領域中不同公司的專利技術研究情況,并把單一的情報綜合起來,然后采取統計分析、技術群組、文本挖掘、組合理論、專利地圖等技術,對其進行情報分析,并以統計圖譜、關聯圖譜和報告等形式展現出來[52]。
專利數據因其與科技、法律、經濟高度關聯,被人們譽為“技術一體化信息”。隨著大數據時代的到來,專利數據挖掘與分析工作將從“盲人摸象”式的“揀著測、挑著存、采著樣處理”,逐步向“皰丁解牛”式的“全樣本、多維度、動態實時化處理”方向發展。不僅各項專利著錄信息(專利權人、發明人、分類號、申請日等)成為重點挖掘與分析對象,相關的工業、企業、商業、法律及政策信息也會被廣泛挖掘和分析[58]。如Kim 等研究了專利侵權起訴網絡,用于挖掘分析不同企業的角色[59]。翟東升構建了基于本體的專利知識庫、面向主題的專利分析系統和中文專利侵權檢索模型,用于專利信息深度挖掘和應用[30]。鄭貴忠、劉金蘭使用生命表法對專利的有效性和平均剩余有效期限等法律信息進行了挖掘和分析[60]。
專利法律信息挖掘與分析通常需要借助專門的專利數據庫和專利挖掘工作來實現。如德溫特專利數據庫除能夠進行專利法律狀態信息檢索外,其自帶的專利數據處理與分析軟件TDA能夠處理和挖掘分析基本專利國、基本專利號、基本專利年、引文專利、德溫特入藏號、德溫特分類、家族專利國、家族專利號、家族專利年、國際分類號、發明人、德溫特手工代碼、專利權人、專利優先權國家、優先號、優先年、技術焦點、專利標題、美國專利號、美國專利年以及文摘等專利法律信息[61]。
1949 年,Seidel最早提出了專利引文分析的概念,認為“專利引文”是后繼專利基于相似的科學觀點而對先前專利的引證,同時他還提出了高頻被引專利的技術相對重要性[62]。
專利引文包括申請人給出的引文(專利文獻和科學論文)和審查員寫進去的對比引文(專利文獻和科學文獻)。專利文獻中的專利引文具有提供索賠證據的作用和目的[63-64]。審查員引文(專利審查對比文獻)是審查員經過相關性程度比較并標識了相應字母的對比文件,對于專利訴訟證據的獲取意義重大[65]。
專利引文分析是利用各種數學及統計學的方法和比較、歸納、抽象、概括等邏輯方法,對專利文獻中的引用與被引用現象進行分析,以便揭示其數量特征和內在規律的專利計量分析方法[36,66]。
隨著專利引文數據日趨規范和透明,引文數據開發技術亦日益成熟。1964年,美國的《科學引文索引》(SCI)首次編制了專利引文索引(Patent Citation Index),但只收錄了科技文獻中引用的專利文獻。20世紀80年代,美國的CHI Research公司把科學引文分析技術擴展到專利引用分析,用于分析企業競爭方向、技術跟蹤和其他產業技術分析。美國的 MICROPATENT 公司開發了美國專利文摘數據庫(CAPS),收集1975 年以來的美國專利中的所有引文信息,并在檢索界面中設立了引文檢索入口。美國的MOGEE 研究與分析協會開發了專利引文分析數據庫(PCAD),包括1975 年至今的美國專利及其引文。歐洲專利局(EPO)開發的 EPOQUE 系統也包含了專利引文數據庫 REFI。在專利引文分析中最著名的是英國德溫特公司于 1995 年建立的專利引文索引(Patent Citation Index)數據庫。1998 年,德溫特公司與美國科技信息研究所(ISI)合并,成立了Thomson Science and Technology(TST),共同開發德溫特創新索引數據庫(Derwent Innovation Index,DII)[36,67-68]。
許多專利檢索和分析系統具有專利引文分析功能,可以進行專利法律信息挖掘與分析。如Innography專利檢索、挖掘與分析系統有專門通過前3代引文跟蹤專利無效證據和后3代引文跟蹤獲取專利侵權的專利無效檢索及侵權檢索,專利訴訟證據獲取顯得更為簡單便捷;WIPS和PATENTICS兩大專利檢索平臺的分析系統都有專利引文檢索模塊,為獲取專利訴訟證據提供支持。大數據和數據挖掘技術的發展為專利引文潛在價值的充分挖掘提供了可能性,借助先進技術可以挖掘的價值主要體現在3個方面[65]:一是專利訴訟中的證據價值;二是知識交流和專利影響力的測量工具價值;三是企業潛在競爭(合作)關系挖掘中的情報價值。
專利引用網絡分析是專利引文分析的重要方向,通過對專利權人的引用網絡進行分析,可以檢測核心專利權人、發現潛在競爭對手等。Sternitzke等研究發現,LED 領域專利權人引用網絡分析可以用于解釋專利權人的市場行為,如合作和專利侵權訴訟等[69]。Hsueh 等指出,基于網絡分析的引用分析是專利引文分析的一種替代方法[70]。基于專利文獻的引用關系,可以延伸出對專利權人和發明人之間的引用關系,可用于鑒別關鍵發明人或專利權人、發掘競爭對手[71]。
(來稿時間:2017年9月)
參考文獻:
1.肖滬衛.專利戰術情報方法與應用[M].上海:上海科學技術文獻出版社,2015:19,21,111,113,204,514.
2.魏曉峰.基于文獻計量的國際專利情報研究進展分析[J].情報科學,2013(5):155-160.
3.孟俊娥.專利檢索策略及應用[M].北京:知識產權出版社,2010:4-6.
4.肖滬衛.專利地圖方法與應用[M].上海:上海交通大學出版社,2011:5,8,14,17,44,75.
5.趙蘊華,桂婕,張運良,等.基于深度標引的專利文本挖掘框架研究[J].數字圖書館論壇,2008(11):1-5.
6.王曰芬,岑詠華,王雪芬.可視化技術在專利信息挖掘與分析中的應用研究[J].數字圖書館論壇,2007(2):33-39.
7.楊鐵軍.專利信息利用技能[M].北京:知識產權出版社,2011:287-333.
8.霍中詳.公知公用技術信息的挖掘[M].北京:知識產權出版社,2014:6.
9.牟萍.專利情報檢索與分析[M].北京:知識產權出版社,2012:158-159.
10.李建蓉.專利信息與利用[M].北京:知識產權出版社,2006:9,335,364.
11.董新蕊,朱振宇.專利分析運用實務[M].北京:國防工業出版社,2016:109-113.
12.文庭孝.專利信息計量學[M].北京:科學出版社,2016:103-105.
13.馬天旗.專利分析方法、圖表解讀與情報挖掘[M].北京:知識產權出版社,2015:35-36.
14.蔡爽,黃魯成.面向技術戰略的專利分析方法述評[J].技術經濟,2008(6):36-40.
15.欒春娟,羅海山,金保德.國際專利研究的核心期刊與主要學科分布[J].情報科學,2010(11):1689-1692.
16.暴海龍,朱東華.專利情報分析方法綜述[J].北京理工大學學報(社會科學版),2002(S1):91-93.
17.馬芳,王效岳.基于數據挖掘技術的專利信息分析[J].情報科學,2008(11):1672-1675.
18.張運鴻,張善杰.物聯網核心技術專利態勢分析:以MEMS技術為例[J]. 物流科技, 2012(5):1-4.
19.王偉.基于專利信息的中國光纖預制棒技術競爭態勢分析[J].科技管理研究,2012(10):33-36.
20. Watanabe C, et al. Patent statistics: deciphering a ‘real’versus a ‘pseudo’ proxy of innovation[J]. Technovation, 2001(21):783-790.
21.姜全紅,張志輝.專利資源量化分析研究綜述[J].情報學報,2007(1):134-140.
22.甘紹寧.專利信息分析管理與應用[M].北京:知識產權出版社,2015:77,205.
23.國家知識產權局,知識產權交易所.專利價值評估操作手冊[M].北京:知識產權出版社,2012.
24.李清海,劉洋,吳泗宗,等.專利價值評價指標概述及層次分析[J].科學學研究,2007(2):281-286.
25. Lan jouw J, Shankerman M. Stylized Facts of Patent Litigation: Value, Scope and Ownership[R].NBER Working Paper No. 6297, 1997.
26. Lerner J. The importance of patent scope: an empirical analysis[J]. Rand Journal of Economics, 1994, 25(2):319- 333.
27.王旭,劉姝,李曉東.快速挖掘核心專利 -Innography專利分析數據庫的功能分析[J].現代情報,2013(9):106-111.
28.徐璐,林楠,鄭洪洋.如何挖掘專利信息中的免費資源[J].遼寧經濟,2010(12):85.
29.陳伯仲.專利信息分析利用與創新[M].北京:知識產權出版社,2012:284-285.
30.翟東升.專利知識挖掘關鍵技術研究[M].北京:知識產權出版社,2013:239.
31.霍中詳.公知公用技術信息的挖掘[M].北京:知識產權出版社,2014:23-33.
32.陳旭,彭智勇,劉斌.專利檢索與分析研究綜述[J].武漢大學學報(工學版),2014(3):420-426.
33. Iwayama M, Fujii I A, Kando N, et al. Overview of patent retrieval task at NTCIR-3[C]//The ACL-2003 Workshop on Patent Corpus Processing, Sapporo, Japan, 2003:24-32.
34. Japan Patent Office, Asia-Pacific Industrial Property Center, JIII. Guide Book for Practical Use of “Patent Map for Each Technology Field” [EB/OL].[2017-05-12].http://www.okpatents.com/phosita/images/patent_map_JPO.pdf.
35. WIPO. Patent map with exercises[EB/OL].[2017-04-25].http://www.WIPO.int/meetings/en/doc_details.jsp?doc_id=19674.
36.侯筱蓉.基于引文路徑分析的專利技術演進圖研究[D].重慶:重慶大學碩士學位論文,2008:5-7.
37.丁月華,李程雄,文貴華,等.專利戰略分析系統的設計與實現[J] .計算機工程,2005(15):211-212.
38. Anant Shivraj. Patent Mapping: The Technology in Patents[J]. Innovation Magazine, 2004(4):1-4.
39.張帆,肖國華,張嫻.專利地圖典型應用研究[J].科技管理研究,2008(2):190-193.
40.岑詠華,王曰芬,王曉蓉.面向企業技術創新決策的專利數據挖掘研究綜述(上)[J].情報理論與實踐,2010(1):126-130.
41.沙振江,張蓉,劉桂鋒.國內專利地圖研究進展與展望[J].情報理論與實踐,2014(8):139-144.
42.肖國華.專利地圖研究與應用[D].成都:四川大學碩士學位論文,2006:3-5.
43. Hyunseok Park,Janghyeok Yoon,Kwangsoo Kim.Identifying patent infringement using SAO based sematic technological similarities[J]. Scientometrics, 2012, 90(2):515-529.
44.李紅,楊向飛.專利地圖在R&D機會發現領域的應用綜述[J].科技進步與對策,2015(16):155-160.
45.岑詠華,王曰芬,王曉蓉.面向企業技術創新決策的專利數據挖掘研究綜述(下)[J].情報理論與實踐,2010(2):124-128.
46. Ronen Feldman,Ido Dagan. Knowledge Discovery in Textual Databases(KDT) [C].Proceedings of the First International Conference on Knowledge Discovery and Data Mining. Montreal,Canada,1995:112-117.
47.陳炘,米黑爾·羅科.納米科技創新與知識圖譜:世界納米科技專利與文獻分析[M].吳樹仙,王琛,譯.北京:科學出版社,2013:49,142.
48.諶志群,張國煊.文本挖掘與中文文本挖掘模型研究[J].情報科學,2007, 25(7):1046-1050.
49. Gabriel Pui Cheong Fung,Jeffrey Xu Yu,Wai Lam.Stock Prediction: Integrating Text Mining Approach using Real-Time News[C]. Proceedings of 2003 IEEE International Conference on Computational Intelligence for Financial Engineering. Hong Kong,China,2003:395-402.
50. Aaron M Cohen,William R Hersh. A Survey of Current Work in Biomedical Text Mining[J]. Briefings in Bioinformatics,2005, 6(1):57-71.
51.屈鵬,張均勝,曾文,等.國內外專利挖掘研究(2005—2014)綜述[J].圖書情報工作,2014(20):131-137.
52.袁冰,朱東華,任智軍.基于數據挖掘技術的專利情報分析方法及實證研究[J].情報雜志,2006(12):99-102.
53.胡阿沛,張靜,雷孝平.基于文本挖掘的專利技術主題分析研究綜述[J].情報雜志,2013(12):88-93.
54.張龍暉.大數據時代的專利分析[J].信息系統工程,2014(2):148-149.
55. Porter A L, Cunningham S W. Tech Mining: Exploiting New Technologies for Competitive Advantage[M]. Hoboken, New Jersey: John Wiley & Sons, Inc., 2005.
56.胡正銀,方曙.專利文本技術挖掘研究進展綜述[J].現代圖書情報技術,2014(6):62-70.
57. Yang Y Y, Akers L, Klose, Yang C B. Text mining and visualization tools - Impressions of emerging capabilities[J]. World Patent Information, 2008, 30(4):280-293.
58.鄧鵬.大數據時代專利分析服務的機遇與挑戰[J].中國發明與專利,2014(2):29-31.
59. Kim H,Song J. Social network analysis of patent infringement law suits[J].Technological Forecasting &Social Change,2013, 80(5):944-955.
60.鄭貴忠,劉金蘭.基于生存分析的專利有效模型研究[J].科學學研究,2010(11):1677 -1683.
61.王春,楊志萍,方曙.利用德溫特分析家軟件開展專利情報研究[J].現代情報,2005(12):14-17.
62. Seidel, A. A Citation System for Patent Office[J]. Journal of the Patent Office Society, 1949(31):554.
63.陳凱,徐峰,程如煙.非專利引文分析研究進展[J].圖書情報工作,2015(5):137-144.
64.張虎膽,楊冠燦,吳恒,等.審查員引文是否應作為專利引文“噪音”被剔除?[J].圖書情報知識,2013(6):77-83.
65.肖冬梅,陳穎.專利審查員引文的特征與價值[J].圖書情報工作,2015(19):6-14.
66. Karki, M. M. S. Patent citation analysis: a policy analysis tool [J]. World Patent Information, 1997, 19(4):269-272.
67.龐景安,黃迎燕.國內外專利引文數據庫的研究與發展[J].情報科學,2004(2):182-187.
68.陳亮,張志強,尚瑋姣.專利引文分析方法研究進展[J].現代圖書情報技術, 2019(7): 75-81.
69. Sternitzke C,Bartkowski A,Schramm R. Visualizing patent statistics by means of social network analysis tools[J]. World Patent Information,2008, 30(2):115-131 .
70. Hsueh C C, Wang C C.The use of social network analysis in knowledge diffusion research from patent data[C].2009 International conference on advances in Social network analysis and mining, Athens: IEEE,2009:393-398.
71.陳云偉,方曙.社會網絡分析方法在專利分析中的應用研究進展[J].圖書情報工作,2012(4):90-95.