尹夢巖 孫 倩
(1.國家知識產權局專利局審查協作廣東中心,廣東 廣州 510000;2.廣州中新知識產權服務有限公司,廣東 廣州 510000)
STN 數據庫系統創建于1983 年,該系統能夠提供完全的科技信息領域的在線服務,由美國化學文摘社(CAS)和德國卡爾斯魯厄(FIZ Karl?sruhe)經營,日本科技情報中心(JICST)在日本代理,其收錄超過200 個科學和技術數據庫,其中化學和生命科學領域的文獻收錄最全,是搜尋上述領域科技文獻的最權威工具[1-2]。CAS 是STN 檢索系統的三個服務中心之一,它生產的所有數據庫都放在了STN 系統中,其收錄了全球98%以上的化工類文獻,是檢索化學化工方面信息最有力的工具。
STN 中最常用的數據庫包括REG 數據庫和CAP 數據庫,其中REG 數據庫是世界卓越的物質數據庫,目前存儲了自1957 年以來的化學物質信息,現已成為化學家、工業企業、情報部門、法規部門鑒定新的化學物質的世界權威[3],是業內公認的化學物質信息“GOLD STANDARD”。REG 數據庫屬于字典型數據庫,一方面可以提供目標藥物化合物的準確化學物質登記號(即CAS 號、字段/RN)、化學物質名稱、分子式、化學結構式等信息,另一方面還具備強大的化合物結構檢索功能,可在創造性評價時實現相似化合物信息的獲取。CAP 數據庫是當今世界上最新最全的化學題錄型數據庫,記錄內容包括題目、作者、出處、索引項、文摘等信息,文獻來源包括8 000 多種國際性刊物、專利、同族專利、技術報告、書籍、會議錄、學位論文等[3]。
要利用STN 檢索高分子化合物,就要充分了解STN 對高分子化合物的標引方式,一般而言,STN中對高分子化合物的單體、聚合物、種類(聚酯、聚酰胺等)、制備方法(PREP)、制備條件和用途(USE、ROLE)等都會進行標引,且標引會存在多個維度,比如既給出聚合物的化學名稱(CN,Chemical No?menclature),也會從結構上標引聚合物的CAS 號(即為RN 號,Registry Number,登記號),還會標引得到聚合物組分的CRN 號(Component Registry Number,組分或組成登記號)。比如對苯二甲酸和乙二醇反應得到聚對苯二甲酸乙二醇酯,對苯二甲酸和乙二醇的RN號就會被標引為聚對苯二甲酸乙二醇酯的CRN號。
STN 包含多個數據庫,不同的數據庫具有各自的特點,比如REG數據庫標引相應的結構,包括RN號、CRN 號以及組分數據(NC,Number Component,組分數量),也會標引聚合物的種類(PCT,Polymer class Terms,聚合物分類),比如聚酯可以表達為Polyester/PCT,CAP數據庫標引專利或文章的摘要、原料等,CASRECT 數據庫標引相應的反應過程,可利用結構式進行反應的檢索[4]。最特別的是STN中可以標引化合物和聚合物的結構,可以直接畫出結構式進行檢索,這是常規的數據庫所不具備的。因此,只有充分了解相應數據庫對高分子的標引方式,才能達到更好的檢索效能和獲取有效的結果,下面結合案例介紹一些聚合物常見的檢索方式和技巧。
STN 數據庫一般會對申請文件中的物質標引RN 號,尤其是涉及實施例的聚合物,使用該RN 號直接檢索,得到的一般為可以破壞相應聚合物新穎性的文獻。
案例1。權利要求1:一種含羥基聚磷酸酯阻燃劑,其特征在于所述阻燃劑的化學結構式,如式(1)。

式中:R 為烷基、芳基、芐基中的一種;聚合度n為不大于20的正整數。
根據申請文件中的記載,本申請的目的在于提供一種含羥基聚磷酸酯阻燃劑,該阻燃劑的阻燃性能好,無鹵,制備工藝簡單,并且對泡沫機械性能影響較小。相應的阻燃劑由小分子磷酸酯和二乙醇胺反應得到,所述的小分子磷酸酯包括甲基磷酸二甲酯、乙基磷酸二甲酯、苯基磷酸二甲酯、苯甲基磷酸二甲酯、甲基磷酸二乙酯、乙基磷酸二乙酯、苯基磷酸二乙酯。使用常規的數據庫檢索,檢索式為:flame retardant or fire retardant and(phosphonate p(diethanol amine or diethanol?amine)),命中28 條檢索結果,檢索結果很少且沒有得到可用的文獻。從本申請的記載可以看出,本申請的關鍵在于最后得到的產物,但該產物尚不存在明確的命名,很難直接通過產物檢索,一般只能通過反應物檢索,而一般數據庫對于反應物的表達也很難區分是共混還是共聚,因此不可避免地存在噪聲以及檢索效率低下的問題。后續對上述檢索結果進行瀏覽后并沒有得到可用對比文件。
使用STN進行檢索,步驟如下。
在CAP數據庫中檢索該專利申請,通過以下命令查看數據庫中對該申請的標引情況。
=>S CN106432740/PN
L1 1 CN106432740/PN
=>SEL RN
E1 THROUGH E36 ASSIGNED
FILE REG
=>S E1-E36
D 1-36 ED RN CRN STR CN CI PCT SR
在查看STN 中對申請文件的標引中發現如下RN號:

RN 31711-27-0 REGISTRY
該RN 號長度較短,意味著該物質在REG 數據庫中收錄的時間較早,很可能有可以破壞申請文件新穎性或創造性的文件,直接使用該RN 號在REG數據庫檢索。
=>S 31711-27-0/RN
L3 1 31711-27-0/RN
轉入CAP數據庫:
=>S L3
L4 3 L3
經瀏覽發現如下標引文獻:

可以看出,該文獻標引的結構和本申請非常相近,經核實原文件,確認該文獻可以用于評述本申請的創造性。因為CAP 數據庫中對結構式也進行了標引,這樣在瀏覽對比文件時也非常方便,可以準確快速地篩選出對比文件。經閱讀該文獻,該對比文件中記載的是通過烷基膦酰氯與氨基醇如二乙醇胺的縮聚制備聚酯,因此在常規數據庫中使用磷酸酯作為檢索關鍵詞無法得到上述文獻,后續在VEN 數據庫中使用phosphonyl chloride+ p(dietha?nolamine)可得到上述對比文件,但對技術理解的要求較高,對于關鍵詞的擴展也要求比較苛刻,比如也可能擴展到phosphonyl halide 而不是膦酰氯,從而漏掉對比文件。由此可見,STN 數據庫的標引對于聚合物的檢索存在著很大的便利。
用RN 號檢索到的一般是新穎性文獻,雖然得到的文獻較為相關,但這樣的檢索是不充分的,應該進一步擴展檢索。這一步的擴展檢索可以利用CRN 進行檢索,這樣既對上位進行了擴展,又不會使擴展范圍太大,保證了檢索結果的有效性。
案例2。權利要求1:一種卷鋁天花板用聚酯樹脂,特征在于其由下列原料制成,包括對苯二甲酸二甲酯、甲基丙二醇、新戊二醇、己二酸、間苯二甲酸、鈦酸正丁酯、亞磷酸三苯酯、二甲苯、S150 芳烴、醋酸丁酯。
本案例說明書中記載的發明目的是針對現有技術的不足,提供一種耐候性、硬度、加工性能優,尤其是成本低廉,更易推廣應用的新成分體系的卷鋁天花板用聚酯樹脂。并指出本發明通過大量試驗篩選得到最佳的原料配比組成,采用對苯二甲酸二甲酯而不采用對苯二甲酸,更有利于工藝合成,可大大提高涂料的機械加工性能,發明中僅使用了少量的間苯,在這個體系中可以顯著提升耐候性、加工性,而且使用大量的己二酸可以大大提高樹脂的柔韌性。
因此可知,對苯二甲酸二甲酯、間苯二甲酸和己二酸的使用是本申請的關鍵,可以主要針對相應組分進行檢索。使用常規數據庫進行檢索如下:((terephthalate? or ?terephthalic acid?)s(isoph?thalic acid or IPA or m-phthalic acid)s(adipate or adipic acid))and(polyester? or C08G63/ic/cpc)。檢索共得到2 031篇文獻,檢索結果較多,因為該檢索中,無法表達各個反應物之間的關系,雖然都進行了限定,但也可能并不是一起反應的,因此在檢索的結果中存在大量的噪聲,且沒有很好的方法進行降噪。
使用STN數據庫進行檢索,如前類似的在CAP數據庫中查看對本申請的標引情況,相應的標引如下:


可見,CAP 數據庫對產物和反應物都進行了標引,對應的即為相應的RN號和CRN號。
第一步,嘗試對整個聚合物的RN號進行檢索,僅有一個結果,為本申請。
然后使用該聚合物的反應原料CRN進行檢索。
=> S 2163-42-0/CRN AND 126-30-7/CRN AND 124-04-9/CRN AND 121-91-5/CRN AND(120-61-6 OR 100-21-0)/CRN
L9 183 2163-42-0/CRN AND 126-30-7/CRN AND 124-04-9/CRN AND 121-91-5/CRN AND(120-61-6 OR 100-21-0)/CRN
結果較多,可以使用PCT(聚合物分類)以及NC(組分數量)進行限定:
=>S L9 AND NC=5 AND POLYESTER/PCT
L10 2 L9 AND NC=5 AND POLYESTER/PCT
然后轉入CAP數據庫檢索:
=>S L10
L11 4 L10
得到4 篇文獻,瀏覽得到的文獻中同樣類似地給出了RN、CRN 以及結構式的標引,兩者得到的聚酯樹脂是非常相似的,瀏覽該對比文件,確認該文獻可用于評述本申請的創造性。
也可在CASREACT 數據庫中畫出結構進行檢索,如式(2)。
但經檢索得到390 篇文獻,結果很多,可能是因為這幾種反應物是比較常見的,而且在CASREACT 數據庫無法適用NC 字段進行去噪,無法快速得到對比文件。
用RN 號和CRN 號可以快速準確地定位到對比文件,但檢索還不全面,STN 中還提供了直接使用結構檢索,在定義結構時可以對結構進行基團等的擴展,比如基團或者連接位置、連接方式等,這樣可以進一步地對檢索結果進行擴展,下面結合案例進行說明。
案例3。一類X-射線顯影的含碘聚碳酸酯/聚酯聚合物,其特征在于其結構,如式(3)。

所述的A 嵌段由下列含碘的碳酸酯類單體中的一種或數種聚合得到,如式(4)。

其中,R1、R2、R3、R4、R5中至少有一個為碘原子,其余為H 原子或烷基或C1 原子或Br 原子或碘代烷基;R6和R7中至少有一個為碘原子,其余為H原子或烷基或C1 原子或Br 原子或碘代烷基。使用常規數據庫檢索如下:+iodine+ s +carbon?ate+,命中2 152 篇文獻,得到的檢索結果較多,瀏覽比較困難,而且沒有較好的方法可以去噪,這是因為在常規數據庫中不好對結構的位置進行表達,比如在上述數據庫中沒有辦法表達碘和碳酸酯的位置關系。
使用STN進行檢索。首先,用RN號、CRN號類似進行檢索,沒有得到可用的對比文件。但上述的檢索還是不全面的,對本申請進行分析,本申請中關鍵在于A 嵌段,A 嵌段的關鍵在于含碘的環碳酸酯結構,但本申請中對于該結構的限定較為復雜,含有六個取代基,如果直接按照上述限定畫出相應的結構式,會很復雜,且較難表達。

本申請的關鍵在于含碘元素,另一個共同點在于都含有環碳酸酯,而兩者的連接方式其實并不重要,只需要檢索含有碘元素的環碳酸酯即可,在這樣的想法下,構建如下的檢索進行檢索。

=>S L7 SSS FUL
L8 253 SEA SSS FUL L7
因為檢索的目標是聚碳酸酯,可以使用Poly?carbonate/PCT進行限定:
=>S L8 AND POLYCARBONATE/PCT
L9 49 L8 AND POLYCARBONATE/PCT
轉入CAP數據庫:
=>S L9
L10 14 L9
瀏覽檢索結果:


可以看出檢索得到的文獻中碳酸酯和碘的位置關系是明確的,而且表達了兩種結構可以通過多種方式進行連接,通過結構瀏覽的結果可以快速定位對比文件。后續對常規數據庫的檢索結果分析,其中包含了該對比文件,但因為檢索結果數量較多,很難將該文件篩選出來。
從上述的案例可以看出,STN 非常適用于高分子尤其是結構的檢索,可以快速準確地得到對比文件。在檢索時既要熟悉STN 標引方式,也要充分理解發明,梳理清楚申請文件的發明構思,抓住發明的重點,利用多種方式表達相應的檢索方式,充分利用不同數據庫的標引特點,就可以準確快速地檢索到好用的對比文件。