鄧慧麗
摘 要 信息檢索領(lǐng)域文獻(xiàn)量巨大,在實際檢索中可能出現(xiàn)關(guān)鍵詞難擴展、檢索時噪聲很大的問題。本文從CPC分類號檢索、關(guān)鍵詞擴展、非專利庫檢索等方面總結(jié)常規(guī)檢索技巧,從多種途徑提高檢索效率,同時以3個案例具體分析以上策略在檢索中的運用。
關(guān)鍵詞 信息檢索 策略 效率
一、引言
為了快速命中對比文件,不同檢索策略的總結(jié)有利于提高檢索效率,例如,關(guān)鍵詞不易擴展時,與IPC相比,CPC分類細(xì)分更加精細(xì),能更好地表達(dá)檢索要素,降低噪聲,[1]而針對高校申請,在非專利庫的檢索變得尤為重要和有效,網(wǎng)絡(luò)載體的非專利信息如論壇等,以及期刊論文均提供大量技術(shù)信息。[2]可見,有效運用檢索策略提高檢索效率是十分必要的。
二、檢索策略總結(jié)
(一)利用CPC分類號和關(guān)鍵詞進行檢索
充分理解申請文件之后,考慮該案件是更適合關(guān)鍵詞檢索還是分類號檢索。了解CPC分類號檢索的特點,與IPC相比,CPC分類更加精細(xì),能更好地表達(dá)檢索要素,降低噪聲。[1]重視CPC分類號的檢索,在準(zhǔn)確確定CPC分類號的基礎(chǔ)上,結(jié)合主要關(guān)鍵詞進行檢索,提高檢索效率和準(zhǔn)確性。
(二)充分理解發(fā)明擴展關(guān)鍵詞進行檢索
從權(quán)利要求和說明書中提取關(guān)鍵詞是常用的關(guān)鍵詞擴展方式,而對于一些申請,權(quán)利要求和說明書中均未有合適的關(guān)鍵詞進行檢索,在充分理解發(fā)明后,可利用專業(yè)知識以及對發(fā)明的理解擴展關(guān)鍵詞進行檢索,提高檢索效率。
(三)非專利庫檢索
從發(fā)明構(gòu)思提取出的關(guān)鍵詞進行檢索,重視對非專利文獻(xiàn)的檢索,合理利用非專利資源,如IEEE、ACM等;借助互聯(lián)網(wǎng)搜索功能,如Google、百度等,充分運用非專利資源,進而提高檢索效率。
三、檢索實例
以上對相關(guān)檢索策略進行了總結(jié),下面分別采用3個實際案例具體分析對應(yīng)檢索策略在檢索中的運用。
(一)案例一:利用CPC分類號和關(guān)鍵詞進行檢索
1.權(quán)利要求。一種照片查找方法,應(yīng)用于移動終端,其特征在于:接收用戶通過查詢信息查詢照片的操作請求,所述查詢信息包括位置信息、時間信息和類別信息中的至少一種信息;判斷帶有預(yù)設(shè)標(biāo)簽的待選擇照片中是否存在與所述查詢信息匹配的目標(biāo)照片;若存在與所述查詢信息匹配的所述目標(biāo)照片,則顯示所述目標(biāo)照片。
2.檢索過程。第一,確定CPC分類號:通過信息檢索技術(shù)領(lǐng)域G06F17/30下CPC查找,其中CPC分類號G06F17/30256涉及使用從圖像數(shù)據(jù)庫中自動獲取圖像內(nèi)容特征的組合進行檢索,體現(xiàn)本申請發(fā)明點。第二,構(gòu)造有效檢索式:G06F17/30256/CPC and(位置or地點or時間or類別or分類)。第三,可快速命中對比文件X:CN 104572905A(一種照片索引創(chuàng)建方法及照片搜索方法及裝置)。
(二)案例二:充分理解發(fā)明擴展關(guān)鍵詞進行檢索
1.權(quán)利要求1。一種視頻圖像數(shù)據(jù)文件中關(guān)鍵區(qū)域信息的存儲方法,包括以下步驟:第一,獲得視頻圖像數(shù)據(jù)文件中關(guān)鍵區(qū)域的坐標(biāo)信息。第二,將所述關(guān)鍵區(qū)域的坐標(biāo)信息轉(zhuǎn)換為位圖。第三,將所述關(guān)鍵區(qū)域的位圖作為索引數(shù)據(jù)進行存儲。
2.檢索過程。第一,充分理解發(fā)明擴展關(guān)鍵詞:發(fā)明點為位圖+索引,充分理解發(fā)明發(fā)現(xiàn),而申請文件中對位圖的表達(dá)比較單一,通過直接檢索沒有檢索到合適對比文件,通過分析實際方案實質(zhì)可知,將坐標(biāo)信息轉(zhuǎn)換為位圖實質(zhì)是用關(guān)鍵區(qū)域的坐標(biāo)信息對所述區(qū)塊進行標(biāo)識,將包含關(guān)鍵區(qū)域的區(qū)塊標(biāo)記為“1”,不包含的標(biāo)記為“0”,得到關(guān)鍵區(qū)域位圖。關(guān)鍵詞擴展:位圖—“二進制”、“0/1”。第二,構(gòu)造檢索式:(視頻s(圖像or圖片))and((位圖or二進制or0/1)s索引)。第三,得到對比文件1:CN101303701A(視頻檢索方法及裝置),公開了發(fā)明點即位圖+索引的存儲及檢索方式。
(三)案例三:非專利庫檢索
1.權(quán)利要求1。一種基于語義共鳴色彩的數(shù)據(jù)可視化方法,包括以下步驟:第一,設(shè)定一組待分配顏色的物品名詞作為詞匯集,根據(jù)名詞的關(guān)鍵詞獲取與其相關(guān)的圖片集。第二,選取合適的調(diào)色板,該調(diào)色板包括待分配顏色的物品的所有顏色。第三,產(chǎn)生圖片并集中每幅圖片的顏色直方圖,根據(jù)顏色直方圖中色彩的分布情況,獲取調(diào)色板中的顏色在顏色直方圖中出現(xiàn)的概率。第四,根據(jù)調(diào)色板中顏色之間的辨識度和在顏色直方圖中出現(xiàn)的概率,將調(diào)色板中的顏色分配到詞匯集中的待分配顏色的物品上,形成關(guān)鍵詞-顏色對并顯示。
2.檢索過程。本申請是一件大學(xué)申請,首先在非專利庫中追蹤發(fā)明人本人論文,未發(fā)現(xiàn)相關(guān)文獻(xiàn),然后轉(zhuǎn)入谷歌學(xué)術(shù),對于檢索關(guān)鍵詞的選擇,說明書中申請人給出一些和申請內(nèi)容相關(guān)的關(guān)鍵詞,如“語義共鳴色”(Semantically Resonant Color)、得到每一對“顏色-詞匯”組合的“共鳴分?jǐn)?shù)”(Affinity Score),在谷歌學(xué)術(shù)中優(yōu)先采用Semantically Resonant Color、Affinity Score進行檢索,找到合適的英文對比文件,公開了本發(fā)明的發(fā)明點。
四、結(jié)語
在信息檢索領(lǐng)域,應(yīng)針對不同的方案制定相應(yīng)的檢索策略,縮小檢索范圍,有效地降低檢索噪聲,提高檢索效率。總而言之,檢索是一個長期積累的過程,在平常的審查過程中,要積極總結(jié)和運用不同的檢索策略,多角度地開展檢索工作,進一步提高檢索水平和審查質(zhì)量。
(作者單位為國家知識產(chǎn)權(quán)局專利局專利審查協(xié)作湖北中心)
參考文獻(xiàn)
[1] 王偉,等.圖像領(lǐng)域G06K9/00的CPC分類研究[J].電視技術(shù),2014(Z2):195-196.
[2] 蘇余鵬,等.專利檢索中的非專利信息檢索[J].中國科技信息,2018(10):26-27.