999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于頻率算符的專利智能化檢索策略及其在農藥等化學領域中的高效運用

2023-07-05 06:22:48嚴華
世界農藥 2023年6期

嚴華

(國家知識產權局專利局專利審查協作北京中心,北京 100160)

國家知識產權局檢索系統的全面升級中上線了智能檢索系統。借助智能化技術,智能檢索系統引入語義檢索引擎,對數據進行了多維度整合,實現了外文文獻中文檢索。但實踐中語義檢索和語義分詞調整等檢索方式仍然存在局限性[1],其根本原因在于“語義智能”不能代替“人”準確地提煉出檢索對象的核心檢索要素,導致推薦文獻準確度不高、噪音大等缺陷。另外,智能檢索系統中的多種檢索方式(如語義檢索、布爾檢索等)及其優缺點,也在一定程度上讓檢索人員存在不知首選何種檢索方式、何時停止檢索等困惑。

專利檢索不僅要求全面、準確,而且還需要檢索人員檢索快、效能高。然而,智能檢索系統關鍵不僅在于立足其自身語義的優勢基礎,還需借助“人”這一角色對檢索對象的準確把握,并快速提取出所需核心檢索要素,構建高效檢索表達式,從而避免“語義智能”自身不足,這種檢索方式被稱為布爾檢索+語義排序,即“人工智慧+機器智能”檢索。“布爾檢索+語義排序”檢索方式的重點在于提取、表達布爾檢索中的檢索要素,以及構建檢索式。其中,既要體現檢索對象的結果,又要契合被檢索對象的目的,使得檢索工作回歸到檢索對象和被檢索對象(文獻)本質的理解。

筆者認為,文獻的本質是作者運用某種技術手段去解決某種技術問題,最終達到某種效果意思的表達。因此,文獻實質上是一群涉及技術手段、技術問題、技術效果等詞語集合且之間又緊密聯系的特征組合。這個“特征組合”就是基本檢索要素池,而這基本檢索要素池中必然存在些文獻著重圍繞其展開的詞語,即“核心檢索要素”,并通常具有如下特點:文獻中出現的次數多且之間的距離近,常常在同句/同段中出現。構建一種能夠準確體現文獻本意的檢索式,無疑是要體現出核心檢索要素在文獻中展現的特點及其之間的緊密關系。

筆者前期研究中發現[2],S 系統中檢索表達式(K1/frec>n1)nd(K2/frec>n2)可有效緊密結合鄰近運算符nd 和frec 的優點,不僅表達了檢索要素出現的頻率,還展示了檢索要素之間緊密聯系,能夠較好地體現發明構思在文獻中展現的特征。同時,詞頻(frec)和詞距(nd)逐漸被得到運用[1]。

基于前期基礎,本文進一步探索檢索表達式(K1/frec>n1) “鄰近/同在算符”(K2/frec>n2)在智能化檢索系統中結合語義排序是否能有助于在農藥等化學領域高效應用,其中鄰近/同在算符選自P、S、nD;為了確定檢索式能否廣泛適用于化學領域專利申請,本文選出農藥及合金領域典型案例,基于語義檢索、語義分詞調整等方式,從多方位、多角度對比分析以明確其普適性。

1 化學領域的應用

化學領域涵蓋了有機、農藥、冶金、高分子等多個技術領域,且申請涉及的技術主題也較為廣泛,包括產品(化合物、藥物組合物等)、方法(如制備方法、分離方法、用途等)。由于各個技術領域和技術主題的申請存在自身的特點,檢索要素的獨立性不同,通常這些申請在構建檢索表達式以及檢索難度也存在較大的差異。下面分別從化合物、制備方法以及組合物方面考察檢索表達式(K1/frec>n1)“鄰近/同在算符”(K2/frec>n2)的適用性。

1.1 化合物

基于撰寫方式,化合物申請可分為馬庫什化合物申請和具體化合物申請,其檢索最大特點:單個核心關鍵詞難以有效、準確地表達出化合物結構,即檢索要素與檢索單元之間依賴性太強,故常借助STN 等平臺進行結構等檢索,在傳統內網檢索平臺上難以構建出有效檢索式。

前期研究[3]中發現,S 系統中運算符nd 和frec能夠有效地將核心關鍵詞緊密結合在一起,準確地表達出化合物共有結構的構成要素,而且形成的檢索式“(K1/frec>n1) 10d(K2/frec>n2)”能夠有效地運用于化合物申請。在此基礎上,本文考察該檢索方式結合智能檢索系統的語義排序,評估化合物申請的檢索效果。

1.1.1 案例1:CN2006101294671

一種具有除草活性的三氟甲基苯基噠嗪類衍生物[3],其特征在于該類衍生物可用通式(I)或(II)表示:

檢索對象解析:涉及一類含有由三氟甲基苯與噠嗪相連接構成母核的化合物,且能用于除草。那么,期望獲得能報道包含三氟甲基苯與噠嗪構成母核化合物的文獻,且最好還能用于除草。

基本檢索要素:三氟甲基苯;噠嗪;除草。

核心關鍵詞:三氟甲基苯;噠嗪。

檢索式:PD<20161121 and(三氟甲基苯/frec>1 A 噠嗪/frec>1)。

檢索結果見表1。

表1 案例1 檢索結果

對于農藥領域化合物申請而言,直接語義檢索以及語義分詞調整檢索均存在漏檢風險,而依據檢索對象的解析以及基本檢索要素池的共性,準確地建立核心檢索要素池并運用鄰近/同在運算符和frec 能夠構建出體現母體結構(即共有特征)的檢索式,即“(三氟甲基苯/frec>1 A 噠嗪/frec>1)”,并利用語義排序(申請號等)能高效、快速獲取對比文件。

1.2 組合物

組合物申請包括2 個以上組分及其相應含量,相應的檢索要素存在2 個以上(依據描述同樣分為核心要素和非核心要素),且每個檢索要素又存在多種不同的表達方式,如Zn,俗稱鋅等,這方面申請尤以合金領域典型。下面結合合金領域的具體案例來探索本文檢索式在智能檢索系統中的應用。

1.2.1 案例2:CN201911406874

權利要求1[1]:Al-Zn-Mg-Cu 合金,其特征包括以下質量百分比計的制備原料:Zn:6.7%~7.2%,Mg:1.7%~2.2%,Cu:0.20%~0.45%,Mn:0.15%~0.30%,Zr:0.05%~0.20%,余量為Al;所述Al-Zn-Mg-Cu合金中,Zn 和Mg 的質量比Zn/Mg 為3.0~4.0,Zn和Mg 的元素總量≤9.2%。

檢索對象解析:涉及一種包含Al、Zn、Mg、Cu 以及Zr 并以特定含量存在的合金。由此,審查員無疑期望獲得能報道一種包含Al、 Zn、Mg、Cu以及Zr 合金的文獻。

基本檢索要素:合金;Al;Zn;M;Cu;Zr;各成分的含量。

核心關鍵詞:Al;Zn;Mg;Cu;Zr;合金。

檢索式:pd<20191231 and((Zn or 鋅)/frec>1 A(鎂or mg)/frec>1A(銅or Cu)/frec>1A(Mn or 錳)/frec>1 A (Zr or 鋯)/frec>1 A (Al or 鋁)/frec>1 A 合金/frec>8)。

檢索結果見表2。

表2 案例2 檢索結果

在組合物申請方面,尤其對于多組分的申請,直接進行語義檢索或全要素檢索檢索,噪聲特別大,難以篩選出對比文件,且也存在漏檢的可能。而基于基本檢索要素的核心關鍵詞,協同使用鄰近/同在算符和詞頻算符(frec)構建的檢索式(即本文檢索式)能夠提高檢索效率。

1.3 制備方法

制備方法方面的申請涵蓋的要素特別多,包括原料、產物、具體步驟、工藝條件等,且發明點涉及的基本檢索要素非常多,直接造成檢索表達方式也是多種多樣,且采用常規的語義檢索和布爾檢索難以獲取到有效對比文件,其根本原因在于檢索式無法體現出核心檢索要素在文獻的特點。下面結合制備方法領域的具體案例來探索本文檢索式的高效應用。

1.3.1 案例3:CN2016108852333

權利要求1:一種酸酐與碳酸二甲酯反應合成羧酸甲酯的方法,其特征是步驟:⑴配料:取原料酸酐、碳酸二甲酯和催化劑,酸酐與碳酸二甲酯的摩爾比為1∶1~1∶100,催化劑用量為酸酐質量分數1%~20%;所述酸酐是脂肪族酸酐或芳香族酸酐;所述催化劑是Lewis 酸或質子酸;⑵反應:在高壓反應容器中,依次加入酸酐、碳酸二甲酯和催化劑,升溫至80~350 ℃,在壓力0.1~10.0 MPa、溫度80~350 ℃下反應1~8 h,停止加熱,降溫至室溫,放去氣體,取出反應后物料;⑶后處理:將反應后物料倒入1~5 倍體積量的飽和碳酸氫鈉水溶液中,用乙酸乙酯或二氯甲烷萃取3 次,合并萃取液、并用無水硫酸鎂或無水硫酸鈉干燥2~3 h 后,過濾,濾液經蒸餾或減壓蒸餾除去溶劑,余下物即為制得的羧酸甲酯。

檢索對象解析:涉及一種碳酸二甲酯對脂肪族酸酐或芳香族酸酐在Lewis 酸或質子酸進行甲基化制備羧酸甲酯的方法,并限定了相應工藝步驟。由此,審查員無疑期望獲得能報道脂肪族酸酐或芳香族酸酐中的任意酸酐與碳酸二甲酯反應制備羧酸甲酯的文獻。

基本檢索要素:脂肪族酸酐;芳香族酸酐;碳酸二甲酯;Lewis 酸;質子酸。

核心關鍵詞:酸酐;碳酸二甲酯。

檢索式:pd<20161011 and(酸酐/frec>1 A 碳酸二甲酯/frec>1)。

檢索結果見表3。

表3 案例3 檢索結果

對于該申請,通常審查員會結合說明書中具體實施例以及從屬權利要求的附加技術特征對基本檢索要素“脂肪族酸酐或芳香族酸酐”進一步擴展為“乙酸酐、丁酸酐、苯甲酸酐”等,采用常規的語義檢索或布爾算符“and”進行檢索,這往往會因擴展不全面而導致漏檢或者噪聲過大等現象。但是,如果審查員能夠依據權利要求的解析、期望文獻以及基本檢索要素之間共有特征“酸酐”和“碳酸二甲酯”,并巧妙利用頻率算符frec 和鄰近/同在運算符構建出體現“酸酐”和“碳酸二甲酯”重要性的檢索表達式,能夠快速獲取到相關文獻。

2 小結

本文以頻率算符為基礎,聯合其他布爾運算符能夠快速降噪,在智能語義排序的加持作用下,實現了“人工智慧+機器智能”協同作用。在檢索實踐中,檢索人員基于檢索對象的解析,確定期望獲取的文獻,明確檢索對象-期望文獻-基本檢索要素之間的共有特征,表達為核心關鍵詞的組合,進而使用詞頻和詞距運算符來協同構建能夠體現這些要素關系的檢索表達式。筆者通過多個案例證實,該方法聚焦檢索對象-期望文獻-基本檢索要素之間的共性,具有農藥等化學領域普適性、檢索要素及關鍵詞使用少、文獻瀏覽量少等優點,有助于在農藥等化學領域中提高檢索效能。

主站蜘蛛池模板: 天天做天天爱天天爽综合区| 色综合a怡红院怡红院首页| 91人妻日韩人妻无码专区精品| 国产呦视频免费视频在线观看| 国产激情无码一区二区APP | 久久亚洲国产视频| 国产亚洲视频在线观看| 欧美α片免费观看| 精品91在线| 中文字幕中文字字幕码一二区| 一本大道视频精品人妻| 97在线国产视频| 国产真实乱人视频| 欧美在线视频a| 中文字幕人成人乱码亚洲电影| 欧美另类图片视频无弹跳第一页| 91久久国产成人免费观看| 青草娱乐极品免费视频| 国产美女91呻吟求| 欧日韩在线不卡视频| 日韩欧美网址| 欧美黄色网站在线看| 日韩精品成人网页视频在线| 亚洲日韩AV无码精品| 亚洲欧洲日本在线| 欧美激情首页| 国产欧美日韩va另类在线播放| 免费一级毛片在线播放傲雪网| 久久国产成人精品国产成人亚洲| 国产乱子伦一区二区=| 日本高清免费一本在线观看| 亚洲无线国产观看| 思思99热精品在线| 中文字幕色站| 亚洲中文字幕日产无码2021| 国产区成人精品视频| 91精品啪在线观看国产91| 国产一级视频久久| 一个色综合久久| 在线五月婷婷| 日本道综合一本久久久88| 国产精品自在在线午夜| 日本尹人综合香蕉在线观看 | 色屁屁一区二区三区视频国产| 国产va视频| 超碰91免费人妻| 欧美啪啪精品| 久久婷婷六月| 永久免费无码日韩视频| 久久无码av三级| 免费无遮挡AV| 99久久这里只精品麻豆| 一级在线毛片| 久久国产精品麻豆系列| 欧美第九页| 亚洲精品卡2卡3卡4卡5卡区| 国产精品欧美在线观看| 国内精品视频在线| 白浆视频在线观看| 国产精品观看视频免费完整版| 国产综合另类小说色区色噜噜| 91在线日韩在线播放| 国产爽爽视频| 精品国产Av电影无码久久久| 亚洲欧美自拍视频| 亚洲精品自产拍在线观看APP| 亚洲精品午夜天堂网页| 欧美一区福利| 亚洲无码高清视频在线观看 | 国产a v无码专区亚洲av| 在线网站18禁| 精品国产一区91在线| 黄色成年视频| 无码aaa视频| 国产精品护士| 国产欧美日韩资源在线观看| 香蕉视频国产精品人| 2020精品极品国产色在线观看| 亚洲第一综合天堂另类专| 久久免费精品琪琪| 国产成人在线小视频| 国产精品三级专区|