999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于機器學習分類算法的高質量專利成果篩選研究

2024-02-18 14:07:58周一夫譚春輝江婷李玥澎畢慧婷汪紅信
現代情報 2024年2期
關鍵詞:機器學習

周一夫 譚春輝 江婷 李玥澎 畢慧婷 汪紅信

關鍵詞:專利成果篩選:高質量專利成果;機器學習:Doc2vec

科技創新是提高社會生產力和綜合國力的重要戰略支撐,促進科技成果轉化、降低成果閑置率已成為當前全球多個國家(地區)科技發展的新要求。伴隨綜合國力的不斷增強和科學技術的飛速發展,我國科技成果數量取得了新的突破,專利申請量和授權量躋身世界第一,但科技成果轉化率和轉化成效并未取得顯著提升。科技成果轉化效率不高目前已成為制約我國躋身世界創新強國的一大障礙。2015年8月,第十二屆全國人民代表大會常務委員會第十六次會議修訂了《中華人民共和國促進科技成果轉化法》,旨在為新形勢下的科技成果轉化活動提供保障和規范,凸顯科技成果日益增長的經濟價值和社會價值。進入“十四五”時期,我國科技成果轉化整體情況雖然有所改善,但仍然存在著轉化率不高、轉化路徑不清晰、供需匹配不明確等問題。為加快建設科技強國、實現高水平科技自立自強的目標規劃,以習近平同志為核心的黨中央高度重視科技創新工作,把促進科技成果轉化擺在十分重要的位置進行謀劃部署。2021年5月,習近平總書記在中央全面深化改革委員會第十九次會議上明確提出“加快推動科技成果轉化應用,加快建設高水平技術交易市場,加大金融投資對科技成果轉化和產業化的支持”的要求,進一步在國家層面明確推進科技成果轉化相關工作的必要性。

促進科技成果轉化是推動經濟社會發展和適應國際競爭形勢的迫切需要,同時也是科技成果應用于生產實踐的重要支撐。專利成果作為科技成果轉化體系中的重要組成部分,如何從海量專利中篩選出適應市場需求的高質量成果,然后有針對性地促進其轉化?解決這一問題不僅有利于提升專利成果轉化成效,同時對我國經濟和科技長期高質量發展具有重要戰略意義。

1文獻回顧

1.1專利成果轉化相關研究

專利成果轉化是一項由政府引導規范、多方主體參與的活動,其具體內涵是指新技術、新發明經過試驗、開發、應用和推廣,實現商品化和產業化,最終實現經濟價值的過程。目前已有不同領域的學者從多角度對其展開深層次剖析,主要聚焦于3個方面:①專利成果轉化政策研究。自改革開放以來,我國各級政府為推動專利成果轉化工作,先后頒布了系列政策并逐步形成一個較為健全的政策體系,學者們也從政策組態效應、政策文本量化、政策優化策略、政策實施效能等不同視角對專利轉化活動進行研究,旨在為后續政策出臺實施、修訂完善、執行落實等環節提供決策支持,達到加速科技成果轉化的目的:國外對專利成果轉化政策關注較少,相關研究從政策對專利申請量的影響、專利保護效果與質量提升的影響等方向進行了探討;②專利成果轉化現狀與對策。在專利轉化過程當中,由于涉及多領域和面臨多重復雜環境,難免遇到各種困境與阻力,因此,不少學者以不同領域的轉化主體為研究對象,對高校、國防、國企等主體的轉化現狀進行梳理,明晰轉化過程中遇到的困境,并從體制機制改革、交易成本模型探究等方面有針對性地提出對策和建議;③專利成果轉化績效研究。轉化績效是衡量成果從理論應用到實際的一項重要指標,已有學者采用層次分析、理論歸納等方法構建評價指標體系,對成果轉化績效進行了評價研究;也有科研人員通過數據包絡分析模型、社會網絡、面板數據模型等視角,探究相關因素對轉化績效的影響程度,以期有效推進創新驅動發展和提升專利成果轉化績效。

1.2專利成果篩選相關研究

隨著專利成果數量的逐年激增,對高質量專利成果的篩選顯得尤為關鍵,傳統人工篩選已無法滿足海量專利的不斷累積,因此吸引了國內外不少學者對專利成果篩選展開相關探究。通過文獻梳理后發現,關于專利成果篩選方法主要有計量學識別、引證關系識別、主題模型識別、機器學習算法識別等。鑒于當前專利成果數量規模,同時相較于其他專利篩選方法,機器學習算法識別具備高效迅速、精度可增長性、結果一一映射性等優點,已經成為目前主流專利成果篩選方法,如Krestel R等通過總結40篇使用深度學習框架對專利分類的文獻,發現相關研究仍處于起步階段,同時預計專利分析的方法將由經典機器學習逐步朝深度學習的方向發展:Liu B C等提出了由自組織映射(SOM)、核主成分分析(KPCA)和支持向量機(SVM)組成的機器學習組合模型,并將其應用于生物醫藥產業專利質量預測:HuYF等在現有三維專利價值評價指標的基礎上增加了跨境維度指標,采用隨機森林、決策樹等機器學習算法對可轉讓專利進行識別,研究發現,機器學習方法能夠較好地支持海量數據中可轉讓專利的識別:張彪等基于技術的新穎性、獨特性和重要性3個維度來構建相關指標,采用K近鄰、邏輯回歸等7種機器學習算法對高價值專利進行篩選:吳潔等基于專利形式特征并結合專利文本特征生成的專利一核心詞匯網絡,通過搭建圖卷積網絡對高質量專利進行自動識別;付振康等從專利壽命視角切人,選取影響專利壽命的相關因素作為識別指標,選用5種深度學習模型對專利壽命進行預測,然后通過設置閾值的方式識別核心專利。

1.3簡要述評

能否有效篩選是專利成果成功轉化的關鍵環節之一,從現有研究來看,仍有可繼續深化之處:①早期由于信息數據等資源相對匱乏、技術手段不夠完善等原因,用客觀數據進行專利篩選的方法不夠成熟,可能存在主觀性較強、組織過程復雜、成本花費較大等弊端;②目前專利成果識別、探測方法主要研究來源多數依靠單點預測和自身形式特征的分析,未能較好地結合地域發展規劃與市場需求,難以保證專利成果識別、探測技術可成功應用到轉化過程中,可能由于需求適應性不足導致專利轉化失敗。

為了彌補上述不足,本文在已有研究的基礎上,進一步將專利成果形式特征與市場需求相結合,綜合運用文本挖掘、專利計量、機器學習等方法,對專利文本.需求文本等材料進行處理與分析,以期形成一套基于客觀數據的自動篩選方法,在一定程度上克服主觀性較強、人財物力花費較大的弊端,為篩選高質量專利成果、促進轉化提供一種可行思路。

2研究設計

2.1研究框架

本文總體思路如下:第一,選定特定領域檢索專利成果并整理其形式特征,按照一定規則對其質量進行人工標注,同時提取專利摘要形成摘要文本;第二,檢索并摘取相應領域產業發展規劃(宏觀)和市場技術需求(微觀)形成需求文本;第三,對摘要文本和需求文本進行Jieba分詞和去停用詞的處理,得到實驗語料集;第四,運用Doc2vec模型將處理后的專利摘要文本和需求文本進行向量化表示,并計算專利摘要語義向量與需求語義合向量之間的余弦相似度,以得到“語義向量匹配度”特征;第五,綜合整理專利成果的形式特征、“語義向量匹配度”特征和質量類別標簽,編寫Py-thon程序調用機器學習算法模型進行訓練與評估,選取性能最優的分類算法模型作為高質量專利成果篩選方法中的內核分類算法;第六,對篩選方法進行應用測試,以驗證篩選方法的可行性。基于上述研究思路,本文制定的研究框架如圖1所示。

2.2關鍵過程

2.2.1專利成果形式特征選取

專利成果的發明人、IPC分類號、同族專利、引用文獻、實質審查時間等均為專利成果的形式特征,現有研究已經證實這些形式特征能夠在一定程度上反映出專利成果的價值。根據形式特征指代價值的不同,本文將其劃分為技術價值特征和法律價值特征兩類:

1)專利成果技術價值特征指標

專利成果的技術價值特征主要反映其所承載的技術內容的先進性、應用前景等,作為專利文獻所承載的核心內容,技術價值應當納入專利成果評價指標體系中。借此,本文選取的專利技術價值特征指標包括發明人數量、技術分類(IPC號)數量、知識產權局引證數量。其中發明人數量反映專利成果研究團隊的規模;技術分類(IPC號)數量反映專利成果涵蓋技術領域的規模;知識產權局引證次數反映專利成果融合其他專利成果的規模。

2)專利成果法律價值特征指標

專利權是一種受國家法律保護的知識產權,專利的法律保護穩定性、侵權可判定性等均會影響該專利的轉化質量與轉化效率。結合本研究總體目標,借鑒冉從敬等、許鑫等的研究成果,選用說明書頁數、實質審查日寸間兩項指標分別反映專利成果的細節描述程度和保護強度。

2.2.2專利成果語義特征與需求語義特征匹配度的計算

為全面評估專利成果價值,本文將專利成果內容文本向量化,通過成果語義向量與需求語義向量進行相似性匹配評估專利成果內容質量,幫助構建更加適應市場發展需求的高質量專利成果篩選方法,處理步驟如下:

1)語義特征提取與向量表示

Doc2vec最早于2014年由谷歌公司的Quoc Le和Tomas Mikolov提出,是一種非監督式深度學習方法,其主要思想是將句子或段落轉化為空間向量。Doc2vec是Word2vec的延伸與拓展,其中Doc2vec在Word2vec的基礎上增加了段落向量,并分別從Word2vec中CBOW和Skip-gram架構的基礎上衍生出PV-DM和PV-DBOW兩種訓練架構(其訓練方式如圖2所示)。在PV-DM架構中,訓練語料中每個段落都有唯一的id(即Paragaph id),在訓練過程中Paragaph id與其他單詞(W)一樣,首先被映射成相同維度的向量,但是被存儲在不同的向量空間當中;在之后一個段落的若干次訓練過程中,Paragaph id保持不變,詞向量與段落向量進行累加或連接來預測句子中的下一個詞語(也相當于每次在預測單詞的概率時,都利用了整個段落或句子的語義),其處理方式類似于Word2vec中的CBOW架構。與PV-DM架構利用上下文與段落預測詞語不同的是,在PV-DBOW架構中,首先直接將段落向量作為輸入單元(但忽略其上下文之間的關系);然后在每次迭代的過程中從文本中采樣得到一個窗口,再從這個窗口中隨機采樣一個單詞作為預測任務進行預測,其處理方式與Word2vec中的Skip-gram架構較為相似。

向量具備空間和大小雙重屬性,向量的加法可用平行四邊形法則來進行描述,如圖3所示,其中F1、F2表示兩個不同的共點向量,它們鄰邊的夾角線F合表示合向量的大小和方向。在本文研究過程中,由于涉及語義向量匹配度的計算,因此需要對需求語義向量進行合向量的計算,用以表征整體需求特征。具體處理步驟如下:首先,采用Doc2vec模型將處理后的需求文本逐條轉化為向量表示;然后編寫Python程序,借鑒平行四邊形法則思想,對上述需求語義向量進行求和得到需求語義合向量,為下一步分析奠定基礎。

基于上述分析,同時綜合考慮本文數據規模和數據特征后,本文決定采用Word2vec向量模型中的PV-DM訓練架構來進行文本向量的訓練。具體處理過程如下:首先將經過分詞和去停處理后的專利摘要文本逐條轉化為專利語義向量:隨后摘取產業發展規劃(宏觀層面)和市場技術需求(微觀層面)相關文本,同樣按照專利摘要文本處理方式將其轉化為若干需求語義向量,并將這些語義向量求和得到需求語義合向量。

2)專利成果語義特征與需求語義特征匹配

將上文處理完成的專利語義向量逐個與需求語義合向量進行余弦相似度的計算,如式(1),得到“語義向量匹配度”特征。

其中A、B分別代表專利摘要語義向量和需求語義合向量,cos代表夾角度數,角度越小,余弦相似度越高。

2.2.3專利成果質量類別標注

機器學習主要可分為監督學習和非監督學習兩類,其主要區別在于是否使用人工標注數據集加以訓練和測試。區別于非監督學習,在監督學習中每個實例的輸入對象(數據特征)和輸出值(監督信號)都是一一對應的,因此在監督學習中往往需要入工對數據集進行標注。此外,監督學習算法是通過分析盡可能多地訓練數據,并由此產生推斷的功能,從而對后續未知實例的標簽進行預測。在本文的研究中,將整理好的專利形式特征和“語義向量匹配度”特征作為監督學習過程中的數據特征,將人工對專利成果質量的標注作為監督學習模型的監督信號,二者共同形成模型訓練所需的數據集。

國家知識產權局于2021年3月首次將戰略性新興產業的發明專利、在海外有同族專利權的發明專利、維持年限超過10年的發明專利、實現較高質押融資金額的發明專利、獲得國家科學技術獎或中國專利獎的發明專利定義為高價值發明專利。但關于高質量專利的定義,目前學界尚未形成統一觀點,如吳潔等將專利維持年限用來表征專利質量;許鑫等認為,高質量專利應具備較強市場競爭力和權力穩定性等特性:徐明等則認為,專利質量的評價標準應當包括技術進步性和經濟效益性。基于上述分析同時考慮數據可獲取性及后續研究需要,本文參考并制定了以下專利質量標注規則,如表1所示。

2.2.4高質量專利成果篩選方法構建

在構建高質量專利成果篩選方法前,需要對上述處理完成的專利成果形式特征、“語義向量匹配度”特征、專利質量類別標簽進行匯總整理,按照8:2的比例劃分為訓練集和測試集,同時在劃分過程中保證訓練集和測試集均等比例包含0類和1類標簽。完成數據集的劃分后,本文進行高質量專利成果篩選方法的構建,構建過程主要包括:機器學習分類算法的選取與訓練、機器學習分類算法訓練效果評估、篩選方法應用測試3個部分。

1)機器學習分類算法的選取與訓練

在機器學習中,常用分類算法模型主要有:K近鄰、線性支持向量機、邏輯回歸、樸素貝葉斯、決策樹、梯度提升決策樹、隨機森林、多層感知機等,鑒于不同算法各有優缺點,本文編寫Python程序,分別調用Sklearn中集成的8類機器學習分類算法對訓練集進行訓練,然后依據訓練結果對測試集進行測試,從中挑選出效果最優的分類算法模型。

2)機器學習分類算法訓練效果評估

準確率(Accurate

Rate)、精確率(PrecisionRate)、召回率(Recall Rate)和F1值是機器學習研究中常用的模型評估指標。準確率為所有正確分類的專利文檔數目與全部專利文檔數的比率,能夠較為直觀、全面地衡量機器學習算法的識別和分類效果:精確率為準確分類專利文檔數與所有預測為該類文檔數的比率;召回率為準確分類文檔數與實際文檔數的比率:F1值為精確度和召回率的調和平均數,是同時考慮精確度和召回率的綜合性評價指標,上述指標計算公式如表2所示。基于上述分析,本文將從8類算法中評估出準確率、召回率和F1值最優的分類算法模型,用于高質量專利成果的篩選。

3)高質量專利成果篩選方法應用測試

所有機器學習分類算法完成測試并計算其準確率、精準率、召回率和F1值后,經人工綜合判斷選取其中性能最優的算法模型作為高質量專利成果篩選的分類算法。選取的分類算法與Word2vec向量模型等處理程序共同構成高質量專利成果篩選方法,并編寫Python執行程序加載完成預處理的測試數據,完成應用測試。

3實證分析

3.1數據采集與處理

由于各省市戰略目標定位與經濟發展狀況存在著一定程度的差異,導致其對科技成果也有著不同的需求,借此,本文將以湖北省為例,選取相關產業規劃和市場需求文本,結合專利成果自身形式特征,進行高質量專利成果篩選方法的研究。在中央出臺的《關于新時代推動中部地區高質量發展的意見》中,“堅持創新發展,構建以先進制造業為支撐的現代產業體系”被擺在首位,湖北省委第+一屆九次全會中提出構建“51020”現代產業體系的設想,旨在發揮好湖北制造業大省的優勢,為實現全省高質量發展奠定產業基礎。基于上述分析,本文選取“先進制造與自動化”領域為研究樣本,采集該領域相關數據開展研究。

湖北省“51020”現代產業體系發展規劃和湖北省制造業發展“十四五”規劃是湖北省推進制造業發展目標的集中體現,對科技成果發展方向具有指導意義。借此,本文摘取湖北省“51020”現代產業體系發展規劃和湖北省制造業發展“十四五”規劃兩份文件中相關文本作為宏觀層面的需求文本來源語料。

個人或企業在生產實踐中遇到的難以攻克的技術問題時,往往需要吸收市面上的專利成果加以利用。考慮到專利成果轉化往往具有一定的時滯性,故本文編寫Python程序爬取科惠網(http://www.5lkehui.com/#/)中于2019年1月1日-2021年12月31日登記的“先進制造與自動化”領域技術需求,經過人工逐條篩選剔除重復或無效數據后,最終獲得429條有效數據作為微觀層面的需求文本原始語料。

發明專利是新技術的重要展現形式。本文在專利之星檢索平臺(https://www. patentstar. com. cn/)中檢索研究所需專利數據。根據研究需要對照IPC部類表檢索F部類(機械工程,照明,加熱,武器,爆破),檢索時間窗口為授權日在2019年1月1日-2021年12月31日的發明專利,檢索時間為2022年7月14日,然后根據其主分類號剔除“先進制造與自動化”領域應用較少的F21(照明)、F41(武器)、F42(爆破)二級類目專利,同時為保證數據的完整性,本文還剔除了不公告發明人的專利數據。篩選完成后的數據分別整理其摘要、發明人數量、IPC號數量、知識產權局引證數量、說明書頁數和實質審查時間,并嚴格按照上文表1制定的標注規則,人工逐條對專利成果質量進行0(低質量)和1(高質量)兩類標注,處理完成后最終獲得4730條有效數據,其中1標簽共2147條,0標簽共2583條。

3.2高質量專利成果篩選方法構建

3.2.1文本向量處理

為保證最終得到的文本向量具備可比性,本文統一設計處理程序,具體操作步驟如下:首先對專利摘要文本和需求文本進行分詞和去停用詞的處理:其次將處理好的專利摘要文本和需求文本按條目分別整理至csv文件中;隨后利用Doc2vec對文本數據進行統一訓練,使其轉化為向量表示(程序參數設置為:向量維數vector—size設置為100維;最小語詞忽略閾值mln—count設置為2;迭代次數epochs設置為10),并將需求文本詞向量求和得到需求語義合向量:最后將專利文本向量逐條與需求語義合向量進行余弦相似度的計算,得到“語義向量匹配度”特征,并整理匯總專利成果形式特征與“語義向量匹配度”特征(數據集示例如表3所示),編寫Python程序進行模型的訓練與評估。

3.2.2算法模型訓練與評估

為提高模型預測性能,本文在訓練模型前首先調用sklearn中集成的網格搜索方法(GridSearch-CV)對不同參數(參數組合)進行交叉驗證以確定最優參數,按照最優參數構建模型訓練方法,各模型最終選取的參數如表4所示。得到最優參數(參數組合)后,編寫Python程序調用8類機器學習算法模型按照各自最優參數組合對訓練集進行訓練,并對測試集進行預測檢驗,各模型預測性能如表5所示。

從表5中可以看出,隨機森林和決策樹兩種分類算法模型的整體準確率為0.85,居所有測試算法模型首位,但從其內部的小類指標角度來看,隨機森林算法模型的各項指標值分布相對更加均衡,這表明該模型對于專利成果質量的預測能力更加穩定,故本文決定選用隨機森林算法模型作為高質量專利成果篩選方法中的內核分類算法。

3.2.3高質量專利成果篩選方法應用測試

基于上文分析結果,本文選取Doc2vec向量模型、隨機森林算法模型等程序,結合分詞與去停用詞等操作來構建應用測試模型并完成測試。應用測試模型包含兩個腳本程序和一個專利特征庫,兩個腳本程序分別為:①txt_to_vector. py,其功能為處理文本向量并構建專利成果的“語義向量匹配度”特征;②prediction. py,其功能為應用隨機森林模型,根據前期測試所得的最優參數對完成處理的專利成果質量進行判斷。專利特征庫中存有前期算法模型訓練過程中形成的“語義向量匹配度”特征和專利成果的形式特征與質量標簽。

為完成篩選方法的應用測試,同時考慮到需求文本的時效性,本文按照上文相同檢索方式,在授權日在2022年1月1日-8月1日專利中,隨機挑選10條已轉化(高質量)和10條未轉化(低質量)的專利數據進行應用測試。具體處理過程如下:首先運行文本處理程序txt_to_vector. py將上述20條專利成果的摘要文本處理為語義向量,完成處理后逐條計算各項專利成果語義向量與需求語義合向量之間的余弦相似度,形成“語義向量匹配度”特征;隨后將專利形式特征與“語義向量匹配度”特征進行匯總整理,整理結果如表6所示;最后運行predic-tion.py加載處理好的應用測試數據集,完成預測后根據其類別標簽的不同輸出預測結果,程序運行完成后輸出與預測結果如圖4所示(其中前10條為高質量專利,后10條為低質量專利)。

從圖4中的預測結果來看,在20條應用測試專利中共有16條專利質量被正確預測(其中包含9條高質量專利和7條低質量專利),整體識別準確率達到0.8,識別效果較好。此外,結合表6結果來看,隨機森林算法模型的泛化性能為0.85,在實際應用測試中表現為0.8,訓練效果和測試效果十分接近,這表明上文提出的高質量專利篩選方法具備一定的可靠性與穩定性,可考慮應用于后續大規模專利數據質量預測工作,輔助人工進行專利篩選,在一定程度上能夠降低人力、物力、財力的消耗,提升專利篩選效率,從而達到促進專利成果高效轉化的目的。

4結論啟示

本文基于“先進制造與自動化”領域專利數據,綜合運用專利計量、自然語言處理、機器學習等方法,結合湖北省自身特色需求,將專利形式特征和“語義向量匹配度”特征相結合,對專利成果質量的識別進行探索。研究發現,隨機森林算法模型在選取的8種算法模型中,整體識別準確率和內部各小類指標綜合表現最優,故本文選取隨機森林算法模型作為高質量專利成果篩選方法中的內核分類算法,并結合Doc2vec向量模型等處理程序完成篩選方法的構建。此外,經過實證測試,本文提出的篩選方法基于客觀數據綜合考慮了專利成果的形式特征、地域發展規劃與技術市場需求,能夠較好地對專利質量進行預測,不僅有利于后續專利篩選工作的實際開展,同時還能為各省市政府相關部門提供決策支持,幫助其較為快速和全面地掌握專利成果整體質量情況,進而推動專利成果加速轉化為生產力,助力經濟高質量發展。

為更好地促進專利成果成功轉化,提升成果利用效率,使其高效服務產業和經濟發展規劃的需要,本文提出以下啟示:

1)規范數據采集,構建并不斷完善各類數據庫。當前各類專利信息和市場需求信息類型繁多且存在大量非結構化數據,在進行高質量專利成果篩選時往往需要花費大量時間和人力去進行數據采集和整理。因此,各省市主管部門(科技局、技術交易所等)可考慮與高校、企業進行合作,定期安排專人負責采集和整理專利成果數據、產業規劃數據和市場需求數據,并將其按照專業領域或IPC號分類存儲,構建并不斷完善專利成果供應庫、產業規劃庫、市場需求庫、高質量專利成果庫等特色數據庫,并結合參考本文提出的篩選方法,實現專利成果供需關系的動態匹配,促進轉化效率的提升,進而達到科技助力經濟發展的效果。

2)加強引導效應,改革管理體制與反饋機制。從政府層面來看,應當積極引導專利成果申報和市場需求登記,一方面,在政策上支持專利成果的申請、審查和審批流程,強化企業(或成果持有人)的知識產權意識;另一方面,引導需求方積極登記,準確精練地表達自身技術需求。此外,科技局、技術交易所等科技成果轉化主管部門可考慮在機器篩選的基礎上,輔助組織人工進行隨機檢驗,并根據檢驗結果及時反饋更新相關數據庫,從而進一步提升高質量專利成果識別的準確率。從科研院所或企業層面來看,成果申報方應以解決實際問題為研究導向,注重提升專利成果技術質量與撰寫質量,加強產學研“一體化”協作,避免出現研發資源浪費和成果閑置。

5結語

世界新一輪科技革命為科技成果涌現創造了新的機遇,推進成果轉化已成為大國博弈的戰略選擇。本文提出的篩選方法為實現自動化篩選高質量專利成果提供了參考方案,能夠有助于識別具有潛在發展前景的專利成果,幫助科技主管部門精準施策,推動構建精準高效的專利成果轉化機制。但同時本文也存在著一些有待完善之處,例如:①本文以湖北省為例,將其相關產業規劃和技術需求與專利成果進行語義向量匹配度的計算,在需求文本數據范圍的考量上可能有所欠缺,但本文主要提供一種篩選思路,旨在為各省(市)結合區域特色需求,從大規模專利中篩選出符合自身需求發展的高質量成果提供參考借鑒,以期降低專利成果閑置率并助力經濟發展:②本文所構建的科技成果篩選方法是基于客觀數據構建得來,雖然能夠在一定程度上減輕相關人員的低級重復工作量并輔助決策,但缺少專家知識與經驗的支持,未來將考慮在篩選過程中融入專家判斷結果作為“案例語義特征”進行輔助篩選,以期更好地為專利成果轉化工作提供決策支持。

猜你喜歡
機器學習
基于詞典與機器學習的中文微博情感分析
基于網絡搜索數據的平遙旅游客流量預測分析
時代金融(2016年27期)2016-11-25 17:51:36
前綴字母為特征在維吾爾語文本情感分類中的研究
科教導刊(2016年26期)2016-11-15 20:19:33
下一代廣播電視網中“人工智能”的應用
活力(2016年8期)2016-11-12 17:30:08
基于支持向量機的金融數據分析研究
基于Spark的大數據計算模型
基于樸素貝葉斯算法的垃圾短信智能識別系統
基于圖的半監督學習方法綜述
機器學習理論在高中自主學習中的應用
極限學習機在圖像分割中的應用
主站蜘蛛池模板: 特级精品毛片免费观看| 欧美日韩国产精品综合| 五月婷婷丁香色| 国国产a国产片免费麻豆| 国产麻豆福利av在线播放 | 国产嫩草在线观看| a级毛片网| 成人毛片在线播放| 午夜少妇精品视频小电影| 国模私拍一区二区三区| 国产欧美日韩专区发布| 日本手机在线视频| 亚洲午夜片| 2020国产在线视精品在| 亚洲高清无码久久久| 欧美高清视频一区二区三区| 91啦中文字幕| 在线免费亚洲无码视频| 天堂网亚洲系列亚洲系列| 免费AV在线播放观看18禁强制| av午夜福利一片免费看| 免费人成网站在线观看欧美| 欧美成人免费| 欧美午夜网站| 久久福利片| 欧美成人精品在线| 国产天天射| 伊人欧美在线| 亚洲免费人成影院| 成人免费视频一区二区三区 | 成人小视频网| 巨熟乳波霸若妻中文观看免费| 2020亚洲精品无码| 亚洲欧美日韩中文字幕一区二区三区| 亚洲国产成人超福利久久精品| 国产在线观看高清不卡| 91精品人妻互换| 在线精品视频成人网| 黄色网在线免费观看| 亚洲美女一区| 欧美日韩国产成人在线观看| 麻豆国产精品视频| 欧美色图久久| 在线观看精品自拍视频| 国产高清免费午夜在线视频| 日韩国产欧美精品在线| 99在线观看国产| 国产青榴视频| 国产在线视频导航| 无遮挡一级毛片呦女视频| 亚洲第一视频免费在线| 91精品日韩人妻无码久久| 久久久黄色片| 亚洲乱码在线播放| 精品国产91爱| 日韩精品专区免费无码aⅴ| 国产一二视频| 欧美激情伊人| 中文字幕日韩久久综合影院| 色婷婷在线影院| 丁香婷婷激情网| 在线观看国产网址你懂的| 全午夜免费一级毛片| 国产精品免费电影| 亚洲一区免费看| 亚洲精品国产综合99| 成人福利一区二区视频在线| 91福利片| 免费国产小视频在线观看| 欧美97色| 欧美无专区| 国产91视频观看| 人妻91无码色偷偷色噜噜噜| 中国黄色一级视频| 在线观看视频一区二区| 亚洲无码精品在线播放| a免费毛片在线播放| 男人的天堂久久精品激情| 亚洲天堂久久新| 91精品日韩人妻无码久久| 国产精品久久国产精麻豆99网站| 亚洲无线一二三四区男男|