999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

專利數(shù)據(jù)檢索與分析系統(tǒng)的設計與實現(xiàn)

2021-06-28 17:40:37管魏琪
電腦知識與技術(shù) 2021年10期

管魏琪

摘要:技術(shù)在繼承與創(chuàng)新中發(fā)展。專利檢索為技術(shù)繼承提供了便利,檢索能夠更快的了解某項技術(shù)同時還能避免重復的勞動;專利分析可以預測領(lǐng)域空白點為創(chuàng)新做指引。專利檢索與分析使企業(yè)明晰世界專利的動態(tài)、避免重復開發(fā)與資金浪費,對企業(yè)而言功勞甚大。本文以鋼鐵、電力產(chǎn)業(yè)專利作為數(shù)據(jù)源構(gòu)建專利數(shù)據(jù)檢索與分析系統(tǒng)。

關(guān)鍵詞:數(shù)據(jù)清洗;專利檢索;專利分析;聚類分析

中圖分類號:TP31? ? ? ? ? 文獻標識碼:A

文章編號:1009-3044(2021)10-0040-03

Abstract: Technology is developed in inheritance and innovation. Patent search provides convenience for technology inheritance, which can quickly understand a certain technology while avoiding duplication of labor; patent analysis can predict gaps in the field and guide innovation. Patent search and analysis enable companies to clarify the dynamics of patents in the world, avoid repeated development and waste of funds, which is a great contribution to companies. This article uses the steel and electric power industry patents as data sources to construct a patent data retrieval and analysis system.

Key words: Data cleaning; patent search; patent analysis; cluster analysis

當科技的進步,伴隨著技術(shù)的更新,專利數(shù)量的涌現(xiàn)。專利存在多種特性與特點。例如專利的復雜性表現(xiàn)為同族專利的復雜性與不同族專利的復雜性,同族專利的復雜性主要體現(xiàn)為同族不同專利會有多個不同優(yōu)先權(quán)人,同族的不同專利又具有一個相同的優(yōu)先權(quán)人,而不同族的復雜性就更好理解,它就為專利涉及多個領(lǐng)域多種方法[1];專利的結(jié)構(gòu)化特點是專利的核心特點,這一特點主要是為了方便去進行專利檢索;專利的抽象性是描繪了專利的本質(zhì)特征,它是一種知識產(chǎn)權(quán)的體現(xiàn)不以人的五官觸覺去認識,不占用任何空間,但是又能以一定的形式為人們所感知的智力創(chuàng)造成果;專利的唯一性主要是來維護自我或地域的智力成果的保障。這些特點使專利數(shù)據(jù)的檢索方式與分析方法對傳統(tǒng)文本的方式與方法發(fā)起了挑戰(zhàn),逐步轉(zhuǎn)化為現(xiàn)代化的信息檢索方式與智能化的分析方法[2]。

1 相關(guān)理論介紹

在本章中主要是對數(shù)據(jù)清洗工作以及專利數(shù)據(jù)信息的分析方法中所需要的理論支持進行描述與表達。

1.1 專利數(shù)據(jù)清洗

專利分析與檢索系統(tǒng)的基礎是充足和完備的數(shù)據(jù)量,本論文采用的是Mysql數(shù)據(jù)庫,它的數(shù)據(jù)類型是結(jié)構(gòu)化數(shù)據(jù)[3]。而本文的數(shù)據(jù)來源是德溫特專利數(shù)據(jù)庫中導出的文本數(shù)據(jù),需要將文本數(shù)據(jù)類型轉(zhuǎn)化為Mysql數(shù)據(jù)庫中的結(jié)構(gòu)化數(shù)據(jù),并對轉(zhuǎn)化過程中產(chǎn)生的“臟”數(shù)據(jù)進行數(shù)據(jù)完整性處理。

數(shù)據(jù)清洗(Data cleaning)是對數(shù)據(jù)進行去空、去錯以及去重的過程,主要目的是實現(xiàn)數(shù)據(jù)的完整性,不因可去除的錯誤信息誤導實驗結(jié)果的正確性[4]。本文數(shù)據(jù)清洗的流程為:

(1)按照專利數(shù)據(jù)標引字段進行截取將文本數(shù)據(jù)轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù)如圖1所示:

(2)一致性檢查,就是對數(shù)據(jù)整體性以及局部各字段類型進行校驗,具體過程是通過數(shù)據(jù)下各字段存在的合理取值范圍和字段之間的相互關(guān)系,以此來檢查數(shù)據(jù)是否存在不合理性,發(fā)現(xiàn)處于正常范圍外、邏輯上下存在不合理或者相互矛盾的數(shù)據(jù)。

(3)數(shù)據(jù)中無效值和缺失值的處理,這一過程是通過前面兩步確認數(shù)據(jù)中存在不合理的數(shù)據(jù)信息即存在一些無效值和缺失值,這時需要給他們進行適當?shù)奶幚硪源藖肀WC數(shù)據(jù)的正確性。

1.2 專利數(shù)據(jù)分析

專利數(shù)據(jù)分析是通過對專利數(shù)據(jù)信息中各個專利信息字段的進行加工以及組合[5](例如:專利的地域字段、專利的申請人字段、專利技術(shù)主題字段等都可以和時間序與專利的申請量進行組合),并通過統(tǒng)計學的方法或者數(shù)據(jù)挖掘的處理手段來使這些信息具有縱覽過去專利的全局情況以及預測未來可研發(fā)領(lǐng)域或者說可加大投入研發(fā)資金的領(lǐng)域的功能[6]。

專利數(shù)據(jù)信息分析可以使它們由普通的專利基本信息變成為能夠為企業(yè)或者個人提供對專利資金研發(fā)的投入、專利未來的布局以及個人專利申請的研發(fā)方向。

2 系統(tǒng)設計

2.1 系統(tǒng)需求分析

對于個人而言,若在申請專利之前甚至可說在投入到專利技術(shù)研究方向之前,若是沒有對于專利檢索的系統(tǒng),那么可能導致專利研究的方向沖突或者是專利已經(jīng)被申請,對于企業(yè)而言,對于研究技術(shù)方向的投入每一份的資金都要去估算它的價值是否能夠盈利或者說在未來公司長遠立場上是否能起到舉足輕重的地位,企業(yè)和個人都是該專利檢索與分析系統(tǒng)的潛在用戶。系統(tǒng)的研發(fā)意義都是從用戶的角度出發(fā),本文從使用者基本需求出發(fā):

(1)用戶的登錄與注冊

任何系統(tǒng)能被廣泛地推廣和使用首先也是最重要的是對于用戶個人信息的保護,本文系統(tǒng)由于為了方便用戶重復使用會保留用戶搜索信息,所以用戶需要一人一賬戶避免因為搜索信息的泄露造成別人關(guān)注和預測你接下來的研究方向。

(2)專利數(shù)據(jù)的檢索

企業(yè)和個人想在某技術(shù)領(lǐng)域進行投入研究之前需要對該技術(shù)領(lǐng)域?qū)@M行技術(shù)專利檢索。本文在專利檢索這個功能模塊主要分為三部分。分別為智能檢索、高級檢索和分來檢索,可以讓用戶根據(jù)自己需求來自我選擇合適的檢索模塊。

(3)專利分析

對于專利信息的數(shù)據(jù)分析,可對于企業(yè)技術(shù)領(lǐng)域研究方向進行預測。在本文系統(tǒng)專利分析這一模塊,進行多例專利分析,統(tǒng)籌分析更有效的對企業(yè)專利技術(shù)領(lǐng)域做出戰(zhàn)略布局。主要有專利概況分析、申請人分析、主要機構(gòu)分析、地域分析、發(fā)明人分析、技術(shù)領(lǐng)域分析、技術(shù)生命周期分析、聚類分析。

(4)生成分析報告

在這一模塊中,主要實現(xiàn)的是對專利分析結(jié)果的可視化界面進行打印生成可視化專利數(shù)據(jù)的分析報告。

2.2 系統(tǒng)框架設計

通過本章開頭所做的需求分析,本文將采用經(jīng)典的三層構(gòu)對專利數(shù)據(jù)檢索與分析系統(tǒng)進行業(yè)務功能可劃分為,如圖2系統(tǒng)的三層結(jié)構(gòu)設計圖所示。

系統(tǒng)的表示層即為用戶與系統(tǒng)的交互UI界面,采用Boostrap框架、Material Design語言進行界面美化和echart圖標庫進行可視化展示。

業(yè)務邏輯層是實現(xiàn)了專利檢索與分析的功能模塊的層。它負責接收前端的HTTP請求與相應的數(shù)據(jù)庫中數(shù)據(jù)的提取回饋。

最后一層數(shù)據(jù)訪問層是實現(xiàn)專利數(shù)據(jù)檢索與分析系統(tǒng)的數(shù)據(jù)儲存和數(shù)據(jù)被訪問功能,在業(yè)務邏輯層得到前端請求響應向數(shù)據(jù)訪問層提取數(shù)據(jù)進行響應,實現(xiàn)信息的交互。

2.3 系統(tǒng)模塊設計

根據(jù)本文系統(tǒng)框架業(yè)務邏輯層,將專利檢索與分析系統(tǒng)的模塊組成進行劃分,共分為4個模塊,分別為登錄注冊模塊、專利檢索模塊、專利分析模塊和報告打印模塊。系統(tǒng)的模塊設計如圖3所示。

2.4 數(shù)據(jù)庫結(jié)構(gòu)設計

一個專利由多條信息字段組成,把相同或者相近屬性字段列為一張表,既保證了數(shù)據(jù)庫表結(jié)構(gòu)的清晰明了,又使在前端調(diào)用數(shù)據(jù)庫信息時SQL語句的結(jié)構(gòu)清晰表達明了。結(jié)構(gòu)化規(guī)范式數(shù)據(jù)庫不僅在錄入數(shù)據(jù)時高效快捷,更能加強表間的級聯(lián),在數(shù)據(jù)量很大的情況下也能提高響應速度。

(1)專利與專利優(yōu)先權(quán)信息存在一對一的關(guān)系,即一個專利對應著一個專利優(yōu)先權(quán)信息,而同時一個專利優(yōu)先權(quán)信息對應著一個專利。

(2)專利與引用專利信息存在多對多的關(guān)系,即一個專利可以引用多個專利,同時一個專利也可以被多個專利引用。

(3)專利與引用文獻存在多對多的關(guān)系,即一個專利可以引用多個文獻信息,而一個文獻信息又可以被多個專利引用。

(4)專利與專利IPC分類信息存在多對一的關(guān)系,即一個專利對應著一個IPC分類號,而一個IPC分類號可以有多個專利。

(5)專利基本信息與專利權(quán)人信息存在多對一的關(guān)系,即一個專利對應著一個專利權(quán)人,而一個專利權(quán)人可以對應多個專利。

(6)專利和發(fā)明人存在多對多的關(guān)系,一個專利對應著多個發(fā)明人,而一個發(fā)明人也對應著多個專利。

(7)專利和專利入藏號存在一對一的關(guān)系,一個專利對應著一個入藏號,同時一個入藏號對應著一個專利。

2.5 系統(tǒng)實現(xiàn)

2.5.1 專利檢索模塊實現(xiàn)

專利檢索模塊主要是滿足用戶對專利檢索的需求,在這一模塊用三種檢索方式,專利檢索的流程如圖4所示。

智能檢索是通過搜索主題詞,例如標題或摘要關(guān)鍵詞等搜索有關(guān)技術(shù)領(lǐng)域?qū)@呒墮z索是用戶自己填寫專利的基本信息如標題、申請人等限制性的搜索專利,這樣好處是能夠快捷地搜索到用戶指定的專利數(shù)據(jù)信息,而分類檢索是按國家的不同搜索用戶想要搜索的某國的相關(guān)技術(shù)領(lǐng)域的專利信息。實現(xiàn)界面如圖5所示。

2.5.2 專利分析模塊

專利分析模塊是該系統(tǒng)的運轉(zhuǎn)核心,檢索的內(nèi)容不加以分析還是無法對企業(yè)或個人做出研究技術(shù)領(lǐng)域的預測和指導。設計從滿足用戶的需求出發(fā),本文在專利分析模塊共實現(xiàn)了專利概況分析、申請人分析、主要機構(gòu)分析、地域分析、發(fā)明人分析、技術(shù)領(lǐng)域分析、技術(shù)生命周期分析和聚類分析八個分析,共同來指導和預測用戶所搜索的有關(guān)技術(shù)領(lǐng)域的專利,為用戶在研究熱點上提供預測或判斷現(xiàn)研究方向上的成長空間。實現(xiàn)頁面如圖6所示。

2.6 系統(tǒng)測試

專利數(shù)據(jù)檢索與分析系統(tǒng)的主要功能是為了方便申請專利個人或申請專利的企業(yè)提供方便、快捷及有效的專利技術(shù)領(lǐng)域檢索以及檢索內(nèi)容的分析。測試將圍繞系統(tǒng)的四大模塊進行測試,分別是用戶登錄注冊模塊測試、專利信息檢索模塊測試、專利信息分析模塊測試和專利分析報告打印模塊測試。如表1所示。

3 結(jié)束語

隨著互聯(lián)網(wǎng)的快速發(fā)展,信息的涌現(xiàn),交流和查閱信息變得快捷高效,研發(fā)人員在專利研究方面日益更新,如果在第一時間能夠查詢和分析出研究熱點那么可以減少很多研究時間和研究費用。

本文系統(tǒng)為用戶提供的服務還有可擴展的空間,未來可在系統(tǒng)上增加專利分析其他方法和專利檢索功能更加快更加準確的方法,通過分析專利相關(guān)技術(shù)指標為用戶提供技術(shù)戰(zhàn)略布局和技術(shù)預測。

參考文獻:

[1] Galhard H,F(xiàn)lorescu D,Shasha D,et al.An extensible framework for data cleaning[C]//Proceedings of 16th International Conference on Data Engineering (Cat.No.00CB37073).February 29 - March 3,2000,San Diego,CA,USA.IEEE,2000:312.

[2] 李繼東,王移芝.基于擴展詞典與語義規(guī)則的中文微博情感分析[J].計算機與現(xiàn)代化,2018(2):89-95.

[3] 朱夢.基于機器學習的中文文本分類算法的研究與實現(xiàn)[D].北京:北京郵電大學,2019.

[4] 張林,錢冠群,樊衛(wèi)國,等.輕型評論的情感分析研究[J].軟件學報,2014,25(12):2790-2807.

[5] 李瓊,陳利.一種改進的支持向量機文本分類方法[J].計算機技術(shù)與發(fā)展,2015,25(5):78-82.

[6] 朱相麗,譚宗穎.專利組合分析在評價企業(yè)技術(shù)競爭力中的應用——以儲氫技術(shù)為例[J].情報雜志,2013,32(4):28-33.

【通聯(lián)編輯:梁書】

主站蜘蛛池模板: 日韩欧美91| 国产农村妇女精品一二区| 欧美成人一区午夜福利在线| 亚洲国产成人精品一二区| 狠狠v日韩v欧美v| 亚洲AV无码久久天堂| 国产波多野结衣中文在线播放 | 91国内外精品自在线播放| 91丝袜美腿高跟国产极品老师| 亚洲精品波多野结衣| AⅤ色综合久久天堂AV色综合| 成人精品午夜福利在线播放| 日本爱爱精品一区二区| 91精品国产综合久久不国产大片| 在线无码av一区二区三区| 久久精品人人做人人| 99在线观看视频免费| 天堂网亚洲综合在线| 国产福利2021最新在线观看| 亚洲女人在线| 米奇精品一区二区三区| 亚洲欧美综合另类图片小说区| jizz国产视频| 四虎国产在线观看| 毛片在线看网站| www.av男人.com| 97se亚洲综合| 特级毛片免费视频| 欧美在线黄| 亚洲精品片911| 欧美激情第一欧美在线| 热伊人99re久久精品最新地| 国内精品手机在线观看视频| 永久免费无码日韩视频| 亚洲无码精彩视频在线观看 | 黄色福利在线| 毛片一区二区在线看| 亚洲高清资源| 日韩中文无码av超清| 18禁影院亚洲专区| 久久香蕉国产线看观看亚洲片| 国产精品免费久久久久影院无码| 四虎永久在线精品国产免费| 国产精品成人免费综合| 老色鬼久久亚洲AV综合| 亚洲视频免| 免费毛片视频| 亚洲综合狠狠| 亚洲中久无码永久在线观看软件 | 五月婷婷综合网| 综合网天天| 色播五月婷婷| 欧美高清三区| 婷婷色一区二区三区| 国产亚洲精品97在线观看| 香蕉精品在线| 中文字幕欧美日韩高清| 手机永久AV在线播放| 国产手机在线小视频免费观看 | 蜜桃视频一区二区三区| 久久99精品国产麻豆宅宅| 伊人激情综合网| 日韩视频免费| 亚洲福利视频网址| 亚洲天堂首页| 亚洲天堂精品视频| 国产在线视频二区| 国产成人久久777777| 91欧洲国产日韩在线人成| 亚洲欧美自拍中文| 老司机精品久久| 久久 午夜福利 张柏芝| 国产屁屁影院| 亚洲色图欧美视频| 四虎在线观看视频高清无码| 欧美一级在线播放| 亚洲第一色视频| 亚洲动漫h| 日本欧美午夜| 欧美另类图片视频无弹跳第一页| 欧美一级黄色影院| 日韩AV无码一区|