999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

專利形成全周期視角下的高價(jià)值專利識(shí)別體系研究

2024-01-01 00:00:00夏蕓魏田苡薇洪楷宣馬碩
科學(xué)與管理 2024年4期
關(guān)鍵詞:機(jī)器學(xué)習(xí)

關(guān)鍵詞:高價(jià)值專利;機(jī)器學(xué)習(xí);支持向量機(jī);神經(jīng)網(wǎng)絡(luò);自適應(yīng)增強(qiáng)

中圖分類號(hào):G306;G255.53 文獻(xiàn)標(biāo)識(shí)碼:A DOI:10.3969/j.issn.1003-8256.2024.04.001

隨著科技革命和產(chǎn)業(yè)變革的深入發(fā)展,科技的重要性愈加突出。在逆全球化的浪潮下,面對(duì)外國技術(shù)封鎖,我國政府高度重視科技自主創(chuàng)新和知識(shí)產(chǎn)權(quán)保護(hù),并積極構(gòu)建以自主創(chuàng)新為核心的創(chuàng)新驅(qū)動(dòng)發(fā)展戰(zhàn)略。自2008年《國家知識(shí)產(chǎn)權(quán)戰(zhàn)略綱要》①實(shí)施后,我國知識(shí)產(chǎn)權(quán)建設(shè)取得了飛躍的成就,近年來我國專利申請(qǐng)量和授權(quán)量都位居世界前列,但我國專利多而不強(qiáng)、大而不精[1],因此識(shí)別具備高交易價(jià)值、高使用價(jià)值的高價(jià)值專利已經(jīng)成為了中國專利高質(zhì)量發(fā)展的重點(diǎn)方向。在此背景下,2014年提出的《深入實(shí)施國家知識(shí)產(chǎn)權(quán)戰(zhàn)略行動(dòng)計(jì)劃(2014—2020年)》,為科技創(chuàng)新提供了更有力的法律保障和政策支持,為專利高質(zhì)量發(fā)展解決了后顧之憂②。緊接著,2021年國務(wù)院印發(fā)的《知識(shí)產(chǎn)權(quán)強(qiáng)國建設(shè)綱要(2021—2035年)》明確了2025年高價(jià)值發(fā)明專利擁有量需達(dá)到12件/萬人③,這充分展現(xiàn)了我國實(shí)施創(chuàng)新驅(qū)動(dòng)發(fā)展的決心。黨的二十大報(bào)告也強(qiáng)調(diào),“高質(zhì)量發(fā)展是全面建設(shè)社會(huì)主義現(xiàn)代化國家的首要任務(wù)”,標(biāo)志著專利價(jià)值成為了象征高質(zhì)量發(fā)展的重要一環(huán)④。由此可見,構(gòu)建科學(xué)、客觀的專利價(jià)值評(píng)估方法,對(duì)推動(dòng)我國經(jīng)濟(jì)轉(zhuǎn)型與科技發(fā)展具有重要意義。

綜上,為了更好地識(shí)別高價(jià)值專利,本文將基于專利形成全周期視角,運(yùn)用機(jī)器學(xué)習(xí)法構(gòu)建高價(jià)值專利識(shí)別模型,旨在幫助政府快速確定高價(jià)值專利并有針對(duì)性地開展高價(jià)值專利培育工作,也能使其有效識(shí)別優(yōu)勢(shì)企業(yè),分析優(yōu)勢(shì)企業(yè)的影響力和地位。除此之外,還能支撐相關(guān)創(chuàng)新主體掌握行業(yè)技術(shù)發(fā)展水平,推斷專利未來的創(chuàng)新發(fā)展?jié)摿εc技術(shù)發(fā)展趨勢(shì),助力其技術(shù)創(chuàng)新活動(dòng)的開展。

1 文獻(xiàn)綜述

現(xiàn)今學(xué)術(shù)界暫未建立起一個(gè)綜合、客觀的高價(jià)值專利識(shí)別指標(biāo)體系。早期研究聚焦于會(huì)計(jì)計(jì)量的視角對(duì)專利價(jià)值進(jìn)行評(píng)估,如貨幣計(jì)量法。貨幣計(jì)量法包括成本法、市場(chǎng)法、收益法等。Parr等[2]將所有類型的單一專利價(jià)值評(píng)估分為基于成本、市場(chǎng)和收入的方法。成本法著重關(guān)注專利研發(fā)階段的成本所產(chǎn)生的專利價(jià)值,這種方法難以準(zhǔn)確評(píng)估專利未來價(jià)值[3]。市場(chǎng)法通過比較專利技術(shù)銷售額或類似技術(shù)許可來進(jìn)行估值。市場(chǎng)法的使用需要滿足以下幾個(gè)條件,首先市場(chǎng)必須是開放的,其次需要有足夠數(shù)量的同類資產(chǎn)交易所,且同類資產(chǎn)交易所的價(jià)格信息必須向公眾公開,最后是交易的雙方必須是獨(dú)立的。若專利數(shù)量大,則該方法難以適用[4]。收益法廣泛運(yùn)用于評(píng)估金融工具和資產(chǎn)。該方法基于預(yù)期原則,通過預(yù)測(cè)專利未來前景計(jì)算預(yù)期經(jīng)濟(jì)收入。若專利數(shù)據(jù)可用性差、專利市場(chǎng)缺乏流動(dòng)性,使用該方法會(huì)導(dǎo)致預(yù)測(cè)結(jié)果存在偏差[5]。

目前有關(guān)高價(jià)值專利識(shí)別、評(píng)估的研究主要從以下三個(gè)角度切入:

(1)基于專利的外部屬性對(duì)專利價(jià)值進(jìn)行評(píng)估,即專利對(duì)技術(shù)識(shí)別的貢獻(xiàn)程度[6],如專利地圖[7]。專利地圖主觀性較強(qiáng),容易受到人為因素影響,同時(shí)專利地圖需要收集、整理并分析大量的專利信息,所以識(shí)別速度較慢,難以反映市場(chǎng)最新技術(shù)趨勢(shì)。馮立杰等[8]將專利地圖與LDA-SNA模型結(jié)合,收集相關(guān)領(lǐng)域?qū)<乙庖姡⒁源藶榛鶞?zhǔn)構(gòu)建專利檢索式進(jìn)行專利樣本篩選,較為依賴專家的主觀判斷。

(2)基于專利的內(nèi)部屬性采用定性的研究方法,通過分析專利的屬性、狀態(tài)、特征對(duì)專利進(jìn)行評(píng)分。國內(nèi)外研究主要圍繞著專利的法律價(jià)值、市場(chǎng)價(jià)值、經(jīng)濟(jì)價(jià)值等層面篩選專利評(píng)估指標(biāo),研究方法大多集中于實(shí)物期權(quán)法以及層次分析法(AHP)、模糊綜合評(píng)價(jià)法(FCE)、主成分分析法等(PCA)等綜合評(píng)價(jià)方法。萬小麗等[9]結(jié)合采用層次分析法和模糊綜合評(píng)價(jià)法對(duì)從技術(shù)價(jià)值、權(quán)利價(jià)值、市場(chǎng)價(jià)值三個(gè)維度選取的17個(gè)指標(biāo)進(jìn)行了專利價(jià)值評(píng)估。李娟等[10]采用AHP和熵權(quán)法,圍繞法律、技術(shù)、經(jīng)濟(jì)層面選取了8個(gè)指標(biāo),以豐田開放專利為樣本深入分析發(fā)明專利的價(jià)值。安同良等[11]使用改進(jìn)的HITS算法與PageRank算法,以中國鋰電池行業(yè)為例,選取專利引用、被引用、施引三個(gè)指標(biāo)構(gòu)建專利與專利、專利與企業(yè)的復(fù)合有向網(wǎng)絡(luò),進(jìn)而測(cè)度識(shí)別每個(gè)專利的價(jià)值。國外學(xué)者則是聚焦于專利經(jīng)濟(jì)價(jià)值、專利對(duì)行業(yè)及企業(yè)績效的影響[12]等方面。Ma等[13]基于價(jià)值捕獲理論,從法律、技術(shù)、市場(chǎng)、企業(yè)四個(gè)維度選取了21個(gè)指標(biāo),將傳統(tǒng)評(píng)估方法中的成本法、收益法與三角模糊數(shù)法相結(jié)合,構(gòu)建了石油行業(yè)的專利評(píng)估模型。Ploskas等[14]提出了基于8個(gè)標(biāo)準(zhǔn)對(duì)22種化學(xué)品的專利進(jìn)行排名的方法。Song等[15]從專利數(shù)量、技術(shù)、法律三個(gè)維度構(gòu)建了專利組合估值體系,運(yùn)用熵權(quán)-雙基點(diǎn)法評(píng)價(jià)企業(yè)特定技術(shù)領(lǐng)域的專利價(jià)值,采用熵權(quán)對(duì)評(píng)估指標(biāo)進(jìn)行賦值,并采用雙基點(diǎn)法對(duì)評(píng)估對(duì)象進(jìn)行排序。Kim等[16]在數(shù)據(jù)包絡(luò)分析法的基礎(chǔ)上,基于專利的共被引關(guān)系構(gòu)建了技術(shù)關(guān)系矩陣,這將有助于企業(yè)較早識(shí)別專利價(jià)值,減少研發(fā)初期所產(chǎn)生的不確定性。

(3)隨著人工智能應(yīng)用的興起,傳統(tǒng)、常規(guī)的專利數(shù)據(jù)研究方法被打破。WIPO 等政策制定者開始關(guān)注知識(shí)產(chǎn)權(quán)與人工智能交叉的維度⑤。Aristodemou等[17]從知識(shí)管理、技術(shù)管理、經(jīng)濟(jì)價(jià)值、信息提取和管理的角度回顧機(jī)器學(xué)習(xí)、深度學(xué)習(xí)和人工神經(jīng)網(wǎng)絡(luò)這類實(shí)踐性較強(qiáng)的知識(shí)產(chǎn)權(quán)數(shù)據(jù)分析方法。機(jī)器學(xué)習(xí)法具備大規(guī)模數(shù)據(jù)的處理能力,該方法可通過非線性模型(如支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)等)來分析專利數(shù)據(jù)復(fù)雜的非線性關(guān)系,更好地揭示專利數(shù)據(jù)中的潛在規(guī)律和趨勢(shì),同時(shí)能夠自動(dòng)從專利文本中提取關(guān)鍵信息,減輕研究人員的工作負(fù)擔(dān)。文中的經(jīng)濟(jì)價(jià)值部分是當(dāng)今學(xué)術(shù)界所探討的熱門主題,人工神經(jīng)網(wǎng)絡(luò)等方法常被用來預(yù)測(cè)經(jīng)濟(jì)發(fā)展、企業(yè)績效等。Lee等[18]運(yùn)用支持向量機(jī)(SVM)從財(cái)務(wù)和技術(shù)角度預(yù)測(cè)企業(yè)績效,SVM 在預(yù)測(cè)企業(yè)績效時(shí)能夠充分利用財(cái)務(wù)和技術(shù)數(shù)據(jù)的特點(diǎn),具有較好的泛化能力和解釋性。Noh等[19]運(yùn)用引用滯后分布、Tobit回歸、多層神經(jīng)網(wǎng)絡(luò)分析電信領(lǐng)域?qū)@源_定不同因素對(duì)專利價(jià)值的影響。Breitzman和Thomas[20]搭建了新興集群模型,使用蒙特卡洛法給模型評(píng)分,利用專利引用信息來識(shí)別新興技術(shù)。Lee等[21]運(yùn)用機(jī)器學(xué)習(xí)法分析美國專利數(shù)據(jù),采用前饋多層神經(jīng)網(wǎng)絡(luò)識(shí)別專利指標(biāo)與引用次數(shù)之間的關(guān)系。Trappey 等[22]對(duì)比分析主成分分析法(PCA)和深度神經(jīng)網(wǎng)絡(luò)對(duì)專利價(jià)值的預(yù)測(cè)效果。人工智能分析方法在處理專利數(shù)據(jù)方面具有多種優(yōu)勢(shì),相較于傳統(tǒng)方法,它們擁有更高的效率和準(zhǔn)確性,因此越來越多的學(xué)者選擇采用這類方法,這些優(yōu)勢(shì)包括大規(guī)模數(shù)據(jù)處理能力、自動(dòng)化特征提取、非線性關(guān)系建模等。通過利用機(jī)器學(xué)習(xí)法,研究人員能夠快速提取并分析專利數(shù)據(jù)中的關(guān)鍵特征和模式,揭示潛在的規(guī)律和趨勢(shì)。

由于高價(jià)值專利需具備高創(chuàng)新性和良好的市場(chǎng)應(yīng)用前景,所以高價(jià)值專利的形成周期比普通專利更長,通過上述分析可以發(fā)現(xiàn),現(xiàn)有研究鮮有從專利形成全周期過程的視角探究高價(jià)值專利價(jià)值篩選指標(biāo)。基于此,本文以珠海市高新技術(shù)上市企業(yè)為研究對(duì)象,從專利技術(shù)研發(fā)、申請(qǐng)、轉(zhuǎn)化運(yùn)用3個(gè)維度構(gòu)建高價(jià)值專利識(shí)別指標(biāo),運(yùn)用機(jī)器學(xué)習(xí)法構(gòu)建高價(jià)值專利識(shí)別模型,并以珠海高新上市企業(yè)的有效發(fā)明專利為例進(jìn)行實(shí)證研究,旨在為企業(yè)及決策機(jī)構(gòu)篩選高價(jià)值專利提供新的視角及模型,以便其盡早識(shí)別出高價(jià)值專利并培育。

2 專利生產(chǎn)全周期視角下的高價(jià)值專利識(shí)別指標(biāo)體系構(gòu)建

借鑒過往研究,在曹偉光等[23]的企業(yè)高價(jià)值專利識(shí)別指標(biāo)體系的基礎(chǔ)上,構(gòu)建基于機(jī)器學(xué)習(xí)法的高價(jià)值專利識(shí)別模型。高價(jià)值專利形成的過程可概括為技術(shù)創(chuàng)造、申請(qǐng)確權(quán)、技術(shù)轉(zhuǎn)化運(yùn)用三個(gè)階段,即高水平技術(shù)研發(fā)類指標(biāo)、高質(zhì)量申請(qǐng)確權(quán)類指標(biāo)、高回報(bào)轉(zhuǎn)化運(yùn)用類指標(biāo),本研究從全周期視角選取識(shí)別指標(biāo)(見表1),以全面衡量高價(jià)值專利。輸入指標(biāo)共3個(gè)一級(jí)指標(biāo)和10個(gè)二級(jí)指標(biāo),輸出指標(biāo)為專利被引數(shù),當(dāng)一項(xiàng)專利被其他專利引用的次數(shù)越多,表示該專利在其技術(shù)領(lǐng)域中的關(guān)聯(lián)度和重要性越高,專利價(jià)值越高[24]。

2.1 高水平技術(shù)研發(fā)類指標(biāo)

高水平技術(shù)研發(fā)類指標(biāo)是從專利的技術(shù)研發(fā)水平角度出發(fā)衡量高價(jià)值專利的質(zhì)量。這一指標(biāo)通常用于衡量專利的創(chuàng)新程度、技術(shù)貢獻(xiàn)程度等方面。

(1)發(fā)明人數(shù)。當(dāng)一項(xiàng)專利的發(fā)明人數(shù)越多時(shí),專利所涉及的知識(shí)基礎(chǔ)越廣,研發(fā)投入的人力成本越大,專利價(jià)值越高[25]。

(2)獨(dú)立權(quán)利要求數(shù)。獨(dú)立權(quán)利要求數(shù)為專利申請(qǐng)中的主要權(quán)利要求,獨(dú)立權(quán)利要求數(shù)越高,專利的保護(hù)力度和侵權(quán)判斷越強(qiáng),專利價(jià)值越高[26]。

(3)技術(shù)廣泛性。技術(shù)廣泛性為主分類號(hào)的IPC數(shù)量,主分類號(hào)的IPC數(shù)量越多,專利技術(shù)多樣性越豐富,專利價(jià)值越高[27]。

2.2 高質(zhì)量申請(qǐng)確權(quán)類指標(biāo)

高質(zhì)量申請(qǐng)確權(quán)類指標(biāo)是指專利從審查到最終獲得專利權(quán)的過程,在這個(gè)過程中專利申請(qǐng)人需要確保所提供的專利權(quán)利內(nèi)容全面且規(guī)范。

(1)授權(quán)周期。授權(quán)周期為專利授權(quán)日減去申請(qǐng)日的時(shí)間長度。授權(quán)周期越長,說明專利復(fù)雜度越高,專利價(jià)值越高。

(2)權(quán)利要求數(shù)。專利的權(quán)利要求數(shù)越多,專利所受到的保護(hù)范圍越廣,專利價(jià)值越高[28]。

(3)同族數(shù)。同族數(shù)越多,說明該專利技術(shù)在全球范圍內(nèi)具有較大影響力和市場(chǎng)價(jià)值,專利的戰(zhàn)略價(jià)值就越高[29]。

(4)專利維持年限。專利維持的時(shí)間越長,說明該技術(shù)投資回報(bào)率高,對(duì)創(chuàng)新主體來說該專利具有重要意義[30]。

2.3 高回報(bào)轉(zhuǎn)化運(yùn)用類指標(biāo)

高回報(bào)轉(zhuǎn)化運(yùn)用類指標(biāo)是指專利在市場(chǎng)中具備高回報(bào)和高適應(yīng)性,未來能夠?yàn)槠髽I(yè)帶來經(jīng)濟(jì)回報(bào)和競(jìng)爭(zhēng)優(yōu)勢(shì)。

(1)許可數(shù)。專利許可數(shù)越多,意味著該技術(shù)具備一定的實(shí)用性和市場(chǎng)認(rèn)可度,專利價(jià)值就越高。

(2)質(zhì)押數(shù)。若專利具有較高的投資價(jià)值,企業(yè)或個(gè)人會(huì)選擇將其作為質(zhì)押物。專利質(zhì)押數(shù)越多可以反映出該專利的商業(yè)價(jià)值越高[31]。

(3)研發(fā)偏側(cè)重點(diǎn)幅度。研發(fā)偏側(cè)重點(diǎn)幅度是指主分類號(hào)的專利量占其總專利量的比值。研發(fā)偏側(cè)重點(diǎn)幅度越高,說明該企業(yè)越精進(jìn)這一領(lǐng)域,專利技術(shù)就越強(qiáng)。

3 基于機(jī)器學(xué)習(xí)的高價(jià)值專利識(shí)別模型構(gòu)建

根據(jù)專利被引次數(shù)構(gòu)建分類器,對(duì)專利的價(jià)值進(jìn)行分類評(píng)價(jià)。本文選擇了支持向量機(jī)(SVM)、神經(jīng)網(wǎng)絡(luò)、自適應(yīng)增強(qiáng)三種機(jī)器學(xué)習(xí)分類方法來構(gòu)建高價(jià)值專利識(shí)別模型(見圖1)。這些方法分別在區(qū)塊鏈技術(shù)專利價(jià)值評(píng)價(jià)[32]、訴訟專利價(jià)值評(píng)價(jià)[33]和人工智能專利價(jià)值分類[1]等領(lǐng)域已經(jīng)成功應(yīng)用。

3.1 分類器構(gòu)建

3.1.1 支持向量機(jī)

支持向量機(jī)(Support Vector Machine,SVM)是一種強(qiáng)大的機(jī)器學(xué)習(xí)算法[34]。SVM的關(guān)鍵思想是找到一個(gè)最大邊界的超平面,使得兩個(gè)不同類別的數(shù)據(jù)點(diǎn)之間的距離最大化[35]。在高價(jià)值專利分類問題中,專利價(jià)值評(píng)價(jià)涉及多個(gè)屬性和特征,并存在異常或噪聲數(shù)據(jù)。面對(duì)這種情況,SVM具有處理高維數(shù)據(jù),處理非線性問題的能力,并對(duì)異常值具有魯棒性,并能夠提供良好的泛化能力。本文使用one-against-one方法來進(jìn)行支持向量機(jī)的多分類,設(shè)訓(xùn)練集數(shù)據(jù)共I 個(gè)類,one-against-one方法是在每兩個(gè)類之間都構(gòu)造一個(gè)二分類SVM,對(duì)于第i 類數(shù)據(jù)和第j 類數(shù)據(jù)(i,j ∈ I),訓(xùn)練一個(gè)二分類SVM,即求解如下二次規(guī)劃問題:

4 實(shí)證分析

當(dāng)前局勢(shì)下,創(chuàng)新是引領(lǐng)發(fā)展的第一動(dòng)力,強(qiáng)國需先強(qiáng)市。珠海市位于珠三角的核心區(qū)域,毗鄰港澳,擁有便捷的交通方式和良好的商業(yè)環(huán)境。這種地理優(yōu)勢(shì)使得珠海成為中國改革開放的先行地之一,吸引了大量國內(nèi)外投資和創(chuàng)新人才涌入。為了充分發(fā)揮地區(qū)優(yōu)勢(shì),珠海市不斷加強(qiáng)在重點(diǎn)技術(shù)領(lǐng)域的知識(shí)產(chǎn)權(quán)創(chuàng)造,并出臺(tái)了多項(xiàng)政策和規(guī)劃來促進(jìn)知識(shí)產(chǎn)權(quán)的高質(zhì)量發(fā)展。珠海市政府于2017 年發(fā)布《建設(shè)知識(shí)產(chǎn)權(quán)強(qiáng)市的意見》,提出要深化知識(shí)產(chǎn)權(quán)領(lǐng)域改革,加快知識(shí)產(chǎn)權(quán)強(qiáng)市建設(shè)。2021年,《珠海經(jīng)濟(jì)特區(qū)科技創(chuàng)新促進(jìn)條例》強(qiáng)調(diào)要深入推進(jìn)珠海市國際科技創(chuàng)新中心的建設(shè)。2022年,《珠海市知識(shí)產(chǎn)權(quán)事業(yè)發(fā)展“十四五”規(guī)劃》明確指出要打造“國內(nèi)領(lǐng)先、國際先進(jìn)”的知識(shí)產(chǎn)權(quán)強(qiáng)市。此外,2022年7月珠海成為首批國家知識(shí)產(chǎn)權(quán)強(qiáng)市建設(shè)試點(diǎn)城市。截至2023年5月,珠海市累計(jì)發(fā)明專利授權(quán)量達(dá)到33 688件,占全省總量的4.81%;發(fā)明專利擁有量達(dá)到130.67件/萬人,比廣東省平均水平高57.57件,連續(xù)12年位列廣東省第二。這些數(shù)據(jù)表明珠海市在知識(shí)產(chǎn)權(quán)領(lǐng)域取得了顯著的成績。高新技術(shù)上市企業(yè)則在珠海市的知識(shí)產(chǎn)權(quán)發(fā)展中起到了主力作用。多年來,珠海市80% 以上的已授權(quán)發(fā)明專利都屬于高新企業(yè),其作為科技創(chuàng)新的領(lǐng)頭羊,在推動(dòng)核心技術(shù)進(jìn)步和產(chǎn)業(yè)升級(jí)方面具有重要影響力。鑒于珠海市在知識(shí)產(chǎn)權(quán)建設(shè)方面具有獨(dú)特的優(yōu)勢(shì)和成就,研究珠海市高價(jià)值專利更具代表性,故以珠海市高新技術(shù)上市企業(yè)為研究樣本。

4.1 數(shù)據(jù)來源與預(yù)處理

本研究以珠海市創(chuàng)新科技局于2022年公布的《珠海市高新技術(shù)企業(yè)名單》為基準(zhǔn),選取了12家高新技術(shù)上市企業(yè)為研究對(duì)象(麗珠集團(tuán)、全志科技、納思達(dá)、健帆生物、遠(yuǎn)光軟件、英博爾、光庫科技、世紀(jì)鼎利、格力電器、潤都股份、寶萊特、航宇微),各項(xiàng)指標(biāo)數(shù)據(jù)均來源于IncoPat數(shù)據(jù)庫,共獲取80 406條發(fā)明專利數(shù)據(jù),在清除無效專利后,最終得到2003—2022年38 931條有效發(fā)明專利數(shù)據(jù)。

4.2 高價(jià)值專利識(shí)別指標(biāo)提取

根據(jù)篩選出的高價(jià)值專利識(shí)別指標(biāo),構(gòu)建基于機(jī)器學(xué)習(xí)的高價(jià)值專利識(shí)別模型。由于使用的機(jī)器學(xué)習(xí)模型為分類模型,需要進(jìn)行專利價(jià)值分類。本文根據(jù)輸出指標(biāo)(專利被引次數(shù))對(duì)專利進(jìn)行分類,視專利3年內(nèi)被引證次數(shù)的Top2%為高被引專利[38],即專利的被引證次數(shù)大于15次,就認(rèn)為該專利是高價(jià)值專利。參考李欣等[39]的專利數(shù)據(jù)分類標(biāo)準(zhǔn),將專利分成A、B、C、D四類,其中A代表專利具有較高的技術(shù)價(jià)值,B級(jí)專利代表具有一定的技術(shù)價(jià)值,C級(jí)專利代表具有一般的技術(shù)價(jià)值,D級(jí)專利代表具有較低的技術(shù)價(jià)值。分類標(biāo)準(zhǔn)及結(jié)果如表2所示。

4.3 高價(jià)值專利識(shí)別模型構(gòu)建

使用3種機(jī)器學(xué)習(xí)方法構(gòu)建高價(jià)值專利識(shí)別模型。根據(jù)專利被引證數(shù)量將專利分成4類,共訓(xùn)練3種4分類機(jī)器學(xué)習(xí)模型。

4.3.1 基于SVM的高價(jià)值專利識(shí)別模型

在Python3.9.13 的環(huán)境下使用Sklearn 庫進(jìn)行基于SVM 的高價(jià)值專利識(shí)別模型構(gòu)建。首先,使用Standardization 進(jìn)行特征縮放,確保各個(gè)特征具有相似的尺度可以提高SVM算法的性能;其次,使用k 折分層抽樣交叉切分法進(jìn)行試驗(yàn),以減少訓(xùn)練集和驗(yàn)證集之間的偏差,其中,k = 5 × k',k' ∈ N,當(dāng)k 改變不會(huì)引起結(jié)果明顯變化時(shí),k 不再增加;然后,使用多種核函數(shù)進(jìn)行性能對(duì)比,包括線性核函數(shù)(Linear Kernel,Linear),多項(xiàng)式核函數(shù)(Polynomial Kernel,Poly),高斯徑向基核函數(shù)(Gaussian RBF Kernel,Rbf),Sigmoid 核函數(shù)(Sigmoid);最后選出最優(yōu)核函數(shù)及參數(shù),作為基于SVM的專利價(jià)值評(píng)價(jià)模型。由表3可知,當(dāng)k=10,核函數(shù)選擇高斯徑向基核函數(shù)時(shí),模型效果最好,因此,本文將該參數(shù)選擇下的模型作為基于SVM的高價(jià)值專利識(shí)別模型。

4.3.2 基于全連接神經(jīng)網(wǎng)絡(luò)的高價(jià)值專利識(shí)別模型

通過Python3.9.13 的環(huán)境下使用Sklearn 庫中的AdaBoostClassifier 類來實(shí)現(xiàn)基于AdaBoost 的高價(jià)值專利識(shí)別模型構(gòu)建。將單層決策樹設(shè)置為基本分類器;迭代次數(shù)為50次;然后對(duì)數(shù)據(jù)采用分層抽樣的k 折交叉驗(yàn)證方法進(jìn)行訓(xùn)練和驗(yàn)證,k 的定義與基于SVM的專利價(jià)值評(píng)價(jià)模型模型相同;使用one-against-one方法來訓(xùn)練I ( I ? 1)/2 個(gè)決策樹來實(shí)現(xiàn)AdaBoost的多分類任務(wù);并計(jì)算評(píng)價(jià)指標(biāo)。由表5可知,當(dāng)k=15時(shí),模型效果最好,因此,本文將該參數(shù)選擇下的模型作為基于AdaBoost的高價(jià)值專利識(shí)別模型。

4.3.4 高價(jià)值專利識(shí)別模型評(píng)估

為選出最適合珠海高新上市企業(yè)的有效發(fā)明專利的高價(jià)值專利識(shí)別模型,對(duì)基于SVM、全連接神經(jīng)網(wǎng)絡(luò)、AdaBoost三種方法的高價(jià)值專利識(shí)別模型進(jìn)行性能對(duì)比。選取準(zhǔn)確率、精確率、召回率和F1分?jǐn)?shù)作為評(píng)價(jià)指標(biāo),性能結(jié)果對(duì)比如表6所示。

由表6可見,三種高價(jià)值專利識(shí)別模型都擁有很強(qiáng)的性能,所有性能指標(biāo)均大于0.85,其中,基于全連接神經(jīng)網(wǎng)絡(luò)的高價(jià)值專利識(shí)別模型在各個(gè)評(píng)價(jià)指標(biāo)的性能都優(yōu)于其他方法,因此,基于全連接神經(jīng)網(wǎng)絡(luò)的高價(jià)值專利識(shí)別模型為三種基于機(jī)器學(xué)習(xí)中的最優(yōu)模型,基于SVM的高價(jià)值專利識(shí)別模型次之。

4.4 基于高價(jià)值專利識(shí)別模型的珠海專利數(shù)據(jù)分析

以珠海炬芯科技股份有限公司為例,選用效果最好的全連接神經(jīng)網(wǎng)絡(luò)作為該案例的高價(jià)值專利識(shí)別模型,以此對(duì)專利價(jià)值進(jìn)行分類。首先對(duì)專利數(shù)據(jù)預(yù)處理,經(jīng)過處理后得到該企業(yè)2007—2023年10月共383條有效發(fā)明專利數(shù)據(jù)。隨后將各類輸入指標(biāo)放入前節(jié)已訓(xùn)練完成的全鏈接神經(jīng)網(wǎng)絡(luò)模型中,得到A、B、C、D 四類分類結(jié)果(表7),可見D 級(jí)專利數(shù)量最多,占比55.87%,A 級(jí)專利和B 級(jí)專利數(shù)量較少,占比分別為15.93% 和7.57%。這意味著大部分的專利都屬于較低的技術(shù)價(jià)值范疇,而相對(duì)較高價(jià)值的專利數(shù)量較少。

其次,為了探究炬芯科技技術(shù)創(chuàng)新發(fā)展的重點(diǎn)領(lǐng)域,對(duì)A類專利進(jìn)行分析,其IPC主分類號(hào)占比情況如圖2所示。其中計(jì)算機(jī)與信息技術(shù)領(lǐng)域(G06)專利的占比達(dá)到40%,發(fā)電、變電或配電領(lǐng)域(H02)的專利和電通信技術(shù)領(lǐng)域(H04)的專利占比緊隨其后,分別為17%和15%。

將主分類號(hào)裁剪出前三位,其中主分類號(hào)和領(lǐng)域的映射關(guān)系如表8所示。炬芯科技股份有限公司屬于計(jì)算機(jī)、通信和其他電子行業(yè),其高價(jià)值專利產(chǎn)出涵蓋了計(jì)算、推算和計(jì)數(shù)、信息存儲(chǔ)、電通信技術(shù)等領(lǐng)域。國家投入了大量資源開展建設(shè)這幾類技術(shù)領(lǐng)域,并對(duì)這些領(lǐng)域的發(fā)展提出了目標(biāo)要求。2023年8月工業(yè)和信息化部、財(cái)政部發(fā)布的《電子信息制造業(yè)2023—2024 年穩(wěn)增長行動(dòng)方案》⑥提出了以下目標(biāo):2023—2024年計(jì)算機(jī)、通信和其他電子設(shè)備制造業(yè)的增加值平均增速5%左右,電子信息制造業(yè)規(guī)模以上企業(yè)營業(yè)收入突破24萬億元。

通過上述分析可以發(fā)現(xiàn),基于全連接神經(jīng)網(wǎng)絡(luò)的高價(jià)值專利識(shí)別模型具備優(yōu)秀的特征提取能力,能夠準(zhǔn)確識(shí)別企業(yè)高價(jià)值專利,便于企業(yè)及決策機(jī)構(gòu)進(jìn)行專利布局、戰(zhàn)略制定等活動(dòng)的開展。

5 結(jié)語

高價(jià)值專利是指具有較高商業(yè)價(jià)值、技術(shù)重要性和市場(chǎng)競(jìng)爭(zhēng)力的專利。對(duì)于政府和企業(yè)而言,識(shí)別高價(jià)值專利對(duì)于創(chuàng)新發(fā)展和提高競(jìng)爭(zhēng)力具有重要意義。本研究以2003—2022年珠海市高新技術(shù)上市企業(yè)數(shù)據(jù)為樣本,構(gòu)建了一種基于機(jī)器學(xué)習(xí)的高價(jià)值專利識(shí)別方法,采用支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)、自適應(yīng)增強(qiáng)三種機(jī)器學(xué)習(xí)分類方法,根據(jù)輸入專利的多維特征對(duì)專利進(jìn)行分類,進(jìn)而識(shí)別高價(jià)值專利。并以珠海高新技術(shù)上市企業(yè)的有效發(fā)明專利為樣本進(jìn)行實(shí)證研究,對(duì)模型性能進(jìn)行了全面的比較和評(píng)估,最后以珠海炬芯科技股份有限公司為例,使用本文的識(shí)別模型分析其專利。結(jié)果表明,基于全連接神經(jīng)網(wǎng)絡(luò)的高價(jià)值專利識(shí)別方法相比于前人所使用的識(shí)別方法具有以下3類優(yōu)勢(shì):一是對(duì)非線性模型的建模能力強(qiáng),不同于SMV使用特定的和函數(shù)引入非線性關(guān)系,也不同與AdaBoost使用弱分類器進(jìn)行線性組合,全連接神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)可以使其學(xué)習(xí)到復(fù)雜的非線性結(jié)構(gòu),對(duì)涉及多維度指標(biāo)、數(shù)據(jù)維度大的模型分類效果尤其明顯;二是特征學(xué)習(xí)更深入,全連接神經(jīng)網(wǎng)絡(luò)能夠自動(dòng)學(xué)習(xí)提取輸入數(shù)據(jù)中的特征,而SVM 和AdaBoost通常依賴手工設(shè)計(jì)的特征或基分類器,這意味著神經(jīng)網(wǎng)絡(luò)可以從數(shù)據(jù)中學(xué)習(xí)到更加抽象和高級(jí)的特征表示,有助于提高分類的準(zhǔn)確性;三是使用k 折交叉驗(yàn)證的模型具有更高的可靠性,由于k 折交叉驗(yàn)證對(duì)模型進(jìn)行多次重復(fù)評(píng)估,將k 次評(píng)估結(jié)果的平均值作為最終評(píng)估指標(biāo),可以減少評(píng)估結(jié)果的方差,提高評(píng)估的可靠性;而固定次數(shù)折交叉驗(yàn)證只有一次評(píng)估結(jié)果,可能受到隨機(jī)性的影響。

除此之外,本研究采用的高價(jià)值專利識(shí)別指標(biāo)均可人工收集獲取,企業(yè)以及決策機(jī)構(gòu)后續(xù)可將未來年份的專利數(shù)據(jù)輸入模型中,對(duì)專利進(jìn)行分類識(shí)別。

現(xiàn)代社會(huì)中,知識(shí)產(chǎn)權(quán)的保護(hù)和科技創(chuàng)新已經(jīng)成為政府和企業(yè)共同關(guān)注的重要議題,本文所構(gòu)建的高價(jià)值專利識(shí)別模型為政府提供了一種更準(zhǔn)確、客觀的專利評(píng)估工具,為政府監(jiān)管和政策制定提供有力支持。同時(shí),該模型通過分析高價(jià)值專利的趨勢(shì)和分布情況,幫助政府制定更有針對(duì)性的產(chǎn)業(yè)政策,鼓勵(lì)和支持相關(guān)領(lǐng)域的創(chuàng)新和發(fā)展,進(jìn)一步推動(dòng)經(jīng)濟(jì)轉(zhuǎn)型升級(jí)。此外,高價(jià)值專利的準(zhǔn)確定位和保護(hù)對(duì)于保護(hù)知識(shí)產(chǎn)權(quán)也至關(guān)重要。借助評(píng)估模型,政府能夠提供更精準(zhǔn)的知識(shí)產(chǎn)權(quán)保護(hù)方案,確保知識(shí)產(chǎn)權(quán)在市場(chǎng)中的合法權(quán)益得到有效保障。從企業(yè)層面而言,本方法能夠幫助企業(yè)優(yōu)化知識(shí)產(chǎn)權(quán)組合,識(shí)別核心專利和技術(shù)方向,指導(dǎo)研發(fā)投入和戰(zhàn)略規(guī)劃,從而提升創(chuàng)新能力和競(jìng)爭(zhēng)優(yōu)勢(shì)。通過對(duì)不同領(lǐng)域、不同類型專利的精準(zhǔn)評(píng)估,企業(yè)能夠獲得個(gè)性化的決策支持和指導(dǎo),提升專利的價(jià)值和競(jìng)爭(zhēng)力,降低侵權(quán)風(fēng)險(xiǎn)。

需要注意的是,雖然本研究建立了一種基于機(jī)器學(xué)習(xí)的高價(jià)值專利識(shí)別方法,并取得了較好的預(yù)測(cè)效果,但高價(jià)值專利的識(shí)別和評(píng)估還需要考慮多個(gè)因素,如市場(chǎng)需求、技術(shù)前景、競(jìng)爭(zhēng)環(huán)境等。因此,政府、企業(yè)等在評(píng)估高價(jià)值專利時(shí),需要結(jié)合多個(gè)角度和多種方法進(jìn)行綜合評(píng)估,未來可選擇更為全面的專利指標(biāo)以及使用更有創(chuàng)新性的模型進(jìn)行優(yōu)化并進(jìn)行更深度的探索。

猜你喜歡
機(jī)器學(xué)習(xí)
基于詞典與機(jī)器學(xué)習(xí)的中文微博情感分析
基于網(wǎng)絡(luò)搜索數(shù)據(jù)的平遙旅游客流量預(yù)測(cè)分析
前綴字母為特征在維吾爾語文本情感分類中的研究
下一代廣播電視網(wǎng)中“人工智能”的應(yīng)用
活力(2016年8期)2016-11-12 17:30:08
基于支持向量機(jī)的金融數(shù)據(jù)分析研究
基于Spark的大數(shù)據(jù)計(jì)算模型
基于樸素貝葉斯算法的垃圾短信智能識(shí)別系統(tǒng)
基于圖的半監(jiān)督學(xué)習(xí)方法綜述
機(jī)器學(xué)習(xí)理論在高中自主學(xué)習(xí)中的應(yīng)用
極限學(xué)習(xí)機(jī)在圖像分割中的應(yīng)用
主站蜘蛛池模板: 亚洲系列无码专区偷窥无码| 久久久久久久久亚洲精品| 日韩亚洲高清一区二区| 国内精品一区二区在线观看| 亚洲成a人片77777在线播放| 亚洲人成色77777在线观看| 国内自拍久第一页| 成年人视频一区二区| 国产一二视频| 亚洲最大综合网| 国产麻豆精品久久一二三| 99国产在线视频| 日韩不卡高清视频| 91热爆在线| 免费女人18毛片a级毛片视频| 91尤物国产尤物福利在线| 欧美成人日韩| 国产成人AV综合久久| 亚洲午夜国产精品无卡| 欧美一区二区丝袜高跟鞋| 国产91无码福利在线| 成人年鲁鲁在线观看视频| 免费欧美一级| 白丝美女办公室高潮喷水视频| 日韩专区第一页| 精品一区二区三区视频免费观看| 日韩国产综合精选| 91外围女在线观看| 国产精品护士| 无码精品福利一区二区三区| 国产精品尹人在线观看| 国产成人一区免费观看| 永久成人无码激情视频免费| 日本草草视频在线观看| 国产幂在线无码精品| 亚洲丝袜第一页| 乱人伦中文视频在线观看免费| 国产91精品调教在线播放| 91在线精品免费免费播放| 91成人在线观看| 青青操国产| 欧美日韩一区二区三| 亚洲 欧美 中文 AⅤ在线视频| 亚洲水蜜桃久久综合网站| 一区二区午夜| 国禁国产you女视频网站| a毛片在线播放| 日本国产在线| 日韩欧美在线观看| 丰满少妇αⅴ无码区| 成人一级黄色毛片| 男人天堂亚洲天堂| 2020极品精品国产| 一级毛片免费观看久| 99热线精品大全在线观看| 一级毛片免费播放视频| 波多野结衣爽到高潮漏水大喷| 国产精品久久久久久久伊一| 又爽又黄又无遮挡网站| 国产成人在线小视频| 日韩高清成人| 日韩中文精品亚洲第三区| 精品亚洲国产成人AV| 99热国产这里只有精品9九 | 免费无遮挡AV| 亚洲成人一区二区| 五月天久久婷婷| 免费福利视频网站| 欧美区国产区| 国产欧美日韩另类| 国产福利免费视频| 国产美女无遮挡免费视频| 99er这里只有精品| 久久精品国产精品青草app| 亚洲欧洲美色一区二区三区| 国产手机在线观看| 国产乱码精品一区二区三区中文| 免费人成网站在线观看欧美| 亚洲男人的天堂久久香蕉| 波多野结衣久久高清免费| 亚洲欧美不卡中文字幕| 波多野结衣中文字幕一区|