文/孫旭華 揭玉斌 王 武
蔡志勇 胡世明
關于我國專題專利數據庫的思考
文/孫旭華 揭玉斌 王 武
蔡志勇 胡世明
專利信息是最活躍、最重要的科技信息,是科技創新的重要源泉。有效運用專利信息,可以降低技術創新的成本,加速技術創新的進程,提高研發的起點,確定正確的研發方向。專題專利數據庫是針對特定科技領域的專業特點和用戶的特殊需求,從海量專利信息數據中進行篩選、加工構建而成,具有專業領域專利信息集中全面、信息挖掘程度高、檢索快速全面準確等優點。與綜合性專利數據庫相比,借助專題專利數據庫進行綜合分析,有利于用戶充分了解競爭環境,借鑒已有技術、避免專利糾紛,客觀制定競爭策略。
專題專利數據庫的開發建設步伐加快,特別是為企業用戶量身訂制了大量特定產品的專題專利數據庫。
(一)國內專題專利數據庫開發建設起步較晚,發展較快,已經初具規模。
近年來,受益于國家自主創新政策的引導和知識產權戰略的實施,專題專利數據庫的開發建設步伐加快,特別是為企業用戶量身訂制了大量特定產品的專題專利數據庫。
目前國內專題專利數據庫的規模大概在700個左右。其中,國家知識產權局專利文獻部和知識產權出版社開發建設了影響比較大的20余個技術主題的專題數據庫;地方知識產權局開發建成300多個專題數據庫;社會信息服務機構開發建成約200個專題數據庫;行業和科技信息服務機構約有30個專題數據庫;其他機構比如大學和企業等建有20多個專題數據庫。
從2005年起,我國專題數據庫建設進入了快速發展期,約80%的專題數據庫是在2005年以后(含2005年)開發建成的。2003年之前建設的專題數據庫只有13個。
(二)目前國內專題專利數據庫建設的投資主體呈多元化態勢,國家有關部門以及部分社會力量都不同程度地開展了專題專利數據庫的開發與建設。
我國約有30家部委科技信息機構、31家省級科技信息機構和62家地市科技信息機構;32家地方專利管理機構、83家知識產權示范城市創建市知識產權局和知識產權試點城市知識產權局、17家地方其他知識產權機構;另外,還有一些企業、科研院所所屬的內部相關機構,都在從事專利信息服務工作。其中已經建有專題專利數據庫的機構共有70家,包括知識產權局系統27家,占38.57%,行業信息服務機構18家,占25.72%;科技信息服務機構和社會信息服務機構各7家,各占10%;其他機構11家,包括企業、大專院校、開發區等,占15.71%。

(三)用戶尤其是企業的專利意識逐漸加強,對專題專利數據庫需求迫切,專題專利數據庫發展潛力巨大。
目前專題專利數據庫的服務對象主要是企業和科研機構,其中服務于企業的專題數據庫占比重最大,達到89%,而服務于科研機構的專題數據庫僅占39%,而且其中47%的專題專利數據庫是受用戶委托開發。這說明經過近幾十年的發展,我國企業的知識產權意識逐步增強,已成為專利信息需求和使用的主體。
我國專題專利數據庫的開發建設與國外同類數據庫相比,在數據的完整性、更新的及時性、統計分析與智能檢索能力以及數據的深加工與增值服務等方面還存在很大差距。
1.專利信息數據源缺乏,多數專題專利數據庫數據完整性和時效性亟待提高。
全面完整、及時準確的專利數據是建設高質量專題專利數據庫的前提和保證。非國家知識產權局系統的行業和科技信息服務機構很難免費或低成本獲得原始專利數據,缺乏完整準確的專利數據源,導致很多專題數據庫存在數據不完整、不準確、更新周期長的問題。
2.4.1 CCT 6項研究均報道了CCT[6-11],各研究間有統計學異質性(P<0.001,I2=84%),采用隨機效應模型進行分析,詳見圖4。Meta分析結果顯示,兩組患者CCT比較差異無統計學意義[MD=-13.63,95%CI(-28.50,1.23),P=0.07]。
而知識產權局系統建設的一大批初加工行業的專利數據庫和企業個性化專利數據庫,其原始專利數據大都是國家知識產權局提供的“七國兩組織”專利數據,尚沒有完全覆蓋世界主要專利國家,數據完整性不足,無法滿足用戶對國外專利數據的需求。同時,由于沒有摘要附圖,影響了用戶對專利信息內容的理解,在一些特定領域,因為缺少專利說明書全文,影響了專利信息分析的質量。
另外,現有的專題專利數據庫對同族專利、法律狀態和引證專利等這些特定信息的揭示遠遠不夠,只有69%的包含有法律狀態信息,49%的包含有同族專利信息,僅有18%的包含有引證專利信息,還有28%的沒有提供以上任何一種信息。而同族專利、法律狀態和引證專利等信息,對于科技創新具有非常重要的意義。因此,現有的專題專利數據庫在數據完整性方面有很大的欠缺。
2.現有專題專利數據庫大多缺乏深度加工和標引,信息挖掘程度偏低,質量有待提高。
國內專利數據深度加工和標引工作尚處于初級階段,開發建設的深加工專題專利數據庫很少。目前國內深加工數據庫只有國家知識產權局的中國藥物專利數據庫(包括中藥和化學藥),北京東方靈盾科技有限公司的世界傳統藥物專利數據庫和世界硅材料專利數據庫,以及廣東省專利信息中心在知識產權出版社指導下建立的家電行業專利數據庫,與發達國家相比,規模和數量上差距甚大。
深度加工和標引需要大量的人力,而我國目前專題專利數據庫建設機構規模普遍偏小。較少規范和標引,造成檢索效率低,使用的人數少,數據庫沒有發揮作用,有的數據庫甚至成為了死庫。
國外則是大力開發深度加工的專利數據庫。像美國化學文摘數據庫、德溫特生物技術文摘數據庫、英國食品科技文摘數據庫等取得成功的一個重要原因,就是進行信息深加工并不斷推出高附加值信息產品。信息的深度加工,不僅為高新技術領域的專業檢索提供了有效的檢索手段,也為信息加工機構帶來了巨額的利潤。
我國科技信息機構擁有科技綜合信息服務的優勢,但是缺乏專利信息資源和專利分析工具軟件;而擁有專利信息資源優勢的知識產權系統機構缺乏從事信息服務的人員與經驗。由于目前國內缺乏這兩類不同隸屬關系的機構有效合作的機制,這就造成了國內已建的專題專利數據庫有的收錄數據不全面,有的服務內容與功能單一,缺乏既具有權威數據、又具有強大功能的實用性專題專利數據庫,難以滿足用戶的創新需求。
國外一般由專業領域的數據提供商、科技信息提供商和專利信息服務機構進行互補性合作,采用多元化的運作模式,即不局限于專利信息服務,更多地綜合了商標、科技信息、市場商情等信息綜合服務,服務內容涉及到數據提供、數據加工、檢索分析平臺和軟件開發、咨詢服務等諸多方面,例如國際三大聯機檢索系統即是集專利與科技信息、行業信息、法律法規、市場商情信息服務于一體,提供全方位、一站式的綜合信息服務。
信息的深度加工,不僅為專業檢索提供了有效的檢索手段,也為信息加工機構帶來了巨額的利潤。
1.建立向專利信息加工機構免費或低成本提供基礎專利信息資源的渠道,為大規模的專利信息深度加工提供支撐。
根據國外多個發達國家的經驗,在專利信息加工利用過程中,專利數據的基本加工和發布由國家專利管理機構負責;而對于數據深加工及服務,則是在開始時由政府支持,然后交由行業協會、社會科技機構、服務機構去實現和運營。這樣做,一是可以動員社會力量和資金投入到各種專利信息的深加工,二是加工和利用過程與用戶緊密結合,更貼近用戶需求,便于開展靈活深入的特色服務。
為促進專利信息服務機構的發展,國家知識產權局應該承擔傳播專利信息的社會責任和義務,向社會各類專利信息服務機構低成本提供原始專利信息數據。當然,也應該明確信息服務機構不能做同質服務,不能簡單地拷貝或下載信息,進而出售這些信息,而是在基礎專利信息基礎上進行深度加工,為社會提供增值專利信息服務。
2.加強對專題專利數據庫建設的統籌規劃與管理,強化專利信息服務人才隊伍的建設。
目前,從總體上看,我國專題專利數據庫還處于一種無序的淺層次的建設狀態,缺乏統籌規劃和管理,缺乏統一的標準,服務質量和水平也參差不齊。建設一個好的專題專利數據庫既需要信息服務人員,同時還必須有專業技術人員的全程參與。
要建設高質量的專題專利數據庫,離不開強大的人才隊伍。國家有關部門(科技部、教育部、人事部、國家知識產權局等)應重視專利信息服務人才隊伍的建設,從高校專業設置、從業標準、職稱評定、繼續教育培訓等各個方面給予統籌規劃與合理安排,培養一批熟練掌握專題專利數據庫開發建設工作的高素質專利信息服務人才。
3.政府加強對專利信息服務機構的宏觀管理和政策扶持
科技部、國家知識產權局聯合有關部門對專利信息服務機構應給予扶持和引導,提高服務機構的專利信息檢索和分析能力、持續跟蹤并分析相關領域專利狀況的能力,鼓勵服務機構積極開展專利分析和預警服務,形成專業的特色服務,為用戶提供高品質的專利信息服務。
政府應加強對專利信息服務相關行業協會的管理,指導行業協會開展機構認證、規范服務、行業自律等工作,同時建立專項資金,支持行業協會在全國范圍內選擇已有一定基礎的信息服務機構,進行必要的基礎建設投入,引導并扶植入選的信息服務機構深入開展包括專利在內的各類知識產權信息服務業務,成為國家知識產權信息服務平臺的執行者。
4.引導與支持建設面向企業用戶的高質量深加工專題數據庫
調查發現,在現有的專題專利數據庫中,47%是受企業用戶委托開發的,這說明由于對產品與技術創新需求的提升,我國企業的知識產權意識逐步增強,已成為專利信息需求和使用的主體。
但由于企業用戶的信息素養相對較低,而目前所建設的專題專利數據庫絕大部分未經過深度加工,因此企業用戶對專題專利數據庫的實際利用率并不高,嚴重影響了企業對專利的利用水平。
為了有效提升企業用戶對專利的利用水平,政府應該設立專項資金,引導與支持專利信息服務機構,與企業進行有效的溝通與交流,建立滿足企業用戶需求的高質量深加工專題專利數據庫。
5.面向創新體系建設,加快構建專題專利數據庫加工與服務平臺,深化對知識產權信息的挖掘利用。
為了從根本上解決國內在知識產權信息利用方面存在的問題,為提高自主創新能力提供重要支撐,借鑒國內外先進技術開發適合我國國情的知識產權信息檢索與利用平臺,將有助于全面快速地獲取和利用知識產權信息資源。因此,盡快建立集成、交互式的專題專利數據庫專業化加工與服務平臺,對相對分散和重復建設的領域,進行相應的篩選和集成整合。對當前尚未建設,但又是國家科技中長期發展綱要所涉及的重點和關鍵領域,積極進行開發建設和部署。
(作者單位:科技部、中國化工信息中心)