999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于主路徑分析的科技演化模式研究
——以基因工程疫苗領域為例

2023-08-30 14:04:12宋愛偉劉心蕊孫昊宇夏煥章袁紅梅
科技管理研究 2023年14期
關鍵詞:科學研究

宋愛偉,劉心蕊,孫昊宇,夏煥章,袁紅梅

(1.沈陽藥科大學工商管理學院,遼寧沈陽 110016;2.沈陽藥科大學生命科學與生物制藥學院,遼寧沈陽 110016)

近年來世界范圍內科學與技術不斷突破創新,全球科技創新的發展態勢發生了顛覆性改變,伴隨著相關專利和期刊論文數量的激增,科研人員顯然已經不能僅僅通過主觀判斷對特定領域內科技演化模式進行準確、快速分析[1],運用大數據分析來探索科學與技術之間的復雜關系逐漸受到學者們的青睞。識別和測量科學與技術之間的聯系對于理解二者之間的相互作用十分重要。探索并厘清特定領域自發展以來科學與技術之間的關聯演化模式,對于科研人員確定研究課題、企業有側重地規劃科技創新戰略以及政府部門政策制定都具有深遠意義。

1 文獻綜述

主路徑分析已被廣泛用于分析特定領域下的技術變化和創新,在科學技術發展路徑探測中具有重要意義。1989 年Hummon 等[2]提出了主路徑思想,并提出了節點對投影數(NPPC)、搜索路徑鏈接數(SPLC)和搜索路徑節點對(SPNP)3 種遍歷算法;Batagelj[3]在前3 種算法的基礎上提出了搜索路徑數(SPC)算法。2005 年,Doreian 等[4]明確了主路徑概念,認為主路徑是在非循環網絡中從源點到匯點的一條通路,該通路的弧具有最高遍歷權重。目前國內外學者有關主路徑的研究可以分為文獻引文網絡主路徑分析和專利引文網絡主路徑分析[5],其中前者主要是通過揭示特定領域的發展脈絡發現領域內核心文獻,而后者則是通過揭示專利技術的演化軌跡識別關鍵核心技術。識別領域內的關鍵文獻或專利及其主流研究線索對于探索科學或技術軌跡具有重要意義。

學者們普遍認為期刊論文是科學的重要載體,專利文獻是技術的最有效載體[6],兩者之間的互動轉化對于加強基礎研究和應用研究之間的聯系、促進技術創新有著重要的意義。自1940 年以來,科學與技術、基礎研究與應用研究之間的關系得到了廣泛討論,如Gardner[7]探索了影響科學與技術關系的因素,并提出科學與技術的4 種關系,包括科學推動技術、技術推動科學、科學技術協同發展和科學與技術獨立發展;Xu 等[8]認為科學與技術二者協同但不等價,在推動創新的過程中彼此匯聚成一個綜合驅動力。總體來說,科學與技術遵循不同的發展邏輯,但具有協同發展、雙向互惠的關系,二者之間的互動能夠推動領域的科技發展[9]。

當前對于科學與技術之間關系的主流研究方法大體劃分為引文分析法、作者與發明人關系分析法、類目映射關系分析法和主題詞分析法4 類。(1)使用引文關系識別科學技術聯系,如Chen 等[10]對論文數據進行了引文分析,通過分析論文被專利引用的情況揭示了科學與技術之間的知識轉移;Huang等[11]通過對燃料電池領域的論文與專利互相引用情況進行分析,探索該領域內科學與技術的交叉引用現象。(2)使用作者與發明人關系分析來識別科學技術聯系,如Chang[12]通過作者與發明人網絡分析構建了科學技術網絡圖,研究了與各技術領域聯系最高的核心科學領域;Wang 等[13]結合專利引用和作者與發明人關系來衡量納米技術中的科技相互作用。(3)使用類目映射分析法,如賴院根[14]提出通過建立中圖分類與IPC 分類的語義關聯來實現論文與專利的類目映射,促進知識在科學與技術間的關聯共享;Verbeek 等[15]將專利IPC 分類與ISI期刊學科分類進行類目映射,以反映技術創新與科學研究之間的知識關聯結構。(4)通過主題詞分析法來識別科學技術聯系,如Ranaei 等[16]利用潛在狄利克雷分配(LDA)主題模型來識別主題,并通過分析不同主題的科技分布來分析醫藥產業的科技聯系;侯劍華等[17]以主題詞為連接點分析風力發電機技術領域科學和專利文獻的共現情況,展現了該領域科學與技術的互動演進規律。

綜上所述,現有研究在科學與技術之間關系的探索上取得了重大成效,但仍然存在以下局限:一是較少研究同時分析科學與技術在時間上和內容上的互動關系,無法具體揭示科學與技術之間的關聯規律;二是以往在科學與技術關系的研究中有關主題的提取通常從整體數據源中獲得,較難發現領域內核心主題;三是現有對科學、技術的定量研究方法大多停留在統計層面,很少深入到文獻或專利的具體文本內容,無法從語義層面來揭示科學與技術之間的演化規律。為此,本研究提出一種主路徑分析與LDA 主題模型相結合的方式,探討科學與技術的動態互動模式、了解科學與技術之間的關系,從而預測科學與技術的發展方向。

2 研究框架及方法

2.1 研究框架

本研究以基因工程疫苗領域為對象,如圖1 所示,首先從Web of Science 數據庫獲取領域科學文獻信息,并從incoPat 專利數據庫中獲取領域專利文獻信息;其次分別構建科學文獻的引文網絡和專利文獻的引文網絡,并借助Pajek 利用SPNP 算法分別對科學文獻和專利文獻提取全局主路徑,再利用Python 通過LDA 主題模型結合專家意見進行文本挖掘,提取科學研究與技術研究的重點主題;最后將科學主題、技術主題進行映射,并利用桑基圖進行呈現,以識別出領域科技演化模式。

圖1 研究框架

2.2 研究方法

根據主路徑分析的路徑結果進行劃分,分別形成科學文獻和專利文獻的發展路徑時間軸,并根據主題間余弦相似度來衡量相似主題。對科學文獻與專利文獻的相似主題,基于主題詞共現詞頻進行連接,從而基于時間的維度從主題的角度識別科學與技術的關系,探討領域內科學與技術之間的互動模式。

2.2.1 主路徑分析

(1)構建引文網絡。分別提取專利數據和文獻數據的引用關系,得到各自的引用矩陣,并構建引文網絡。在引文網絡中,專利或文獻被看作節點,節點之間的引用和被引用關系表示知識的擴散[18]。

(2)提取主路徑。首先是遍歷計數算法的選擇。遍歷計數是表征知識流動或知識演化中節點對路徑連通重要程度的指標,目前的主流算法有SPC、SPLC、SPNP 和NPPC,其中以SPC 和SPNP 算法受認可度最高[19]。由于SPNP 算法對路徑的起點和終點并沒有特殊要求,同時中間節點具備儲存和傳遞已有知識和生產新知識的特性,適用于強調中介重要性的網絡[20],因此為了探索出具有核心技術的路徑,借助Pajek 采用SPNP 算法提取專利和文獻引文網絡主路徑。

(3)路徑搜索算法的選擇。常見的路徑搜索算法有局域搜索、全局搜索、關鍵路線搜索等[21]。局域搜索常常會陷入局域最優而錯過全局最大邊權和的路徑;全局搜索方法則可以找到邊權和最大的路徑[22]。全局主路徑是以節點在知識流動中的全局重要性為基礎,提取網絡中具有最大遍歷計數的路徑,可以發現網絡中全部的重要路徑[23],因此,采取全局主路徑的路徑搜索算法來提取專利與文獻引文網絡主路徑。

2.2.2 LDA 主題分析

(1)數據處理。分別提取所獲得主路徑上的專利標題、摘要以及權利要求書和文獻標題、摘要以及正文內容并形成文本,對文本進行分詞,將每個文本轉換成一條詞向量,最后去除詞向量中與專利或論文核心觀點無關的詞匯,得到每篇專利或論文的最終詞向量。

(2)確定最佳主題數。LDA 主題提取的效果與潛在主題數K 相關[24]。借鑒Mikolov 等[25]的研究,采用評價函數困惑度(perplexity)來確定科學文獻和專利文獻的最優主題數。通常認為困惑度越小,確定的主題數更優,一般情況下當困惑度下降趨勢不再明顯或處于拐點處時,此時的k值為最優主題數。

(3)“主題-詞”概率矩陣和“文檔-主題”概率矩陣的生成。LDA 是一種文檔主題生成模型,由Blei 等[26]于2003 年提出,其在文檔、主題、詞語3 個層次上計算語義關聯度。通過對每篇論文或專利對應的主題概率分布矩陣以及不同主題的詞匯概率分布矩陣,可以挖掘科學文獻或專利文獻的主題。該模型認為文檔是具有不同概率的主題的集合,而主題是具有不同概率的單詞的集合[27]。借鑒白如江等[28]的研究,每個文檔都可以表示成一系列主題的混合分布,記為P(z),且每個主題為詞匯表中所有單詞上的概率分布,記為P(w|z)。文檔中每個單詞的概率分布如下所示:

2.2.3 科技演化模式分析

計算科學文獻主題與專利文獻主題之間的余弦相似度來衡量主題間的相似程度,通常認為余弦相似度值越高,主題間存在演化關系的概率越大。T代表專利文獻主題,S 代表科學文獻主題。

3 實證研究——以基因工程疫苗領域為例

近年來,我國明確大力發展生物醫藥行業,疫苗行業作為該領域的重要子產業也是大力發展的對象。而基因工程疫苗作為分子生物技術發展的新興產物,與傳統疫苗相比具有生產成本低、免疫途徑廣泛、安全性高等優點,已成為生物制品產業發展的一種趨勢。因此,本研究選取基因工程疫苗領域進行實證研究,通過探索領域內的專利文獻和科學文獻之間的關系,來厘清該領域內科學與技術的關聯演化模式,同時證明本研究所設計方法的應用價值。

3.1 研究數據

分別通過incoPat 專利數據庫和Web of Science數據庫進行基因工程疫苗領域的專利數據和文獻數據收集,檢索日期截至2022 年8 月5 日,共搜索得到16 447 篇專利文獻和6 195 篇科學文獻。基于對這些文獻及專利的大量閱讀,清洗不相關數據,最終確定8 861 項專利數據和5 042 篇科學文獻作為研究樣本。

3.2 主路徑分析結果

3.2.1 專利文獻

使用公開號作為專利文獻的代表,提取專利數據中包含的全部引用信息,基于專利文獻間的引用關系構建專利引用矩陣,形成可視化引文網絡。借助Pajek 運用SPNP 算法提取樣本專利文獻全局主路徑,共得到70 項專利數據(見圖2),申請時間跨度從1978 年至2022 年。具體節點的專利號及標題信息如表1 所示。

表1 樣本專利文獻路徑節點信息(節選)

圖2 樣本專利文獻全局主路徑

3.2.2 科學文獻

使用DOI 號作為科學文獻的代表,提取樣本科學文獻數據的全部引用信息,基于科學文獻間的引用關系構建文獻引用矩陣,形成可視化引文網絡。借助Pajek 運用SPNP 算法提取樣本科學文獻的全局主路徑,結果如圖3 所示,最終得到60 項科學文獻數據,申請時間跨度從1991 年至2022 年。具體節點的DOI 號及標題信息如表2 所示。

表2 樣本科學文獻路徑節點信息(節選)

圖3 樣本科學文獻全局主路徑

3.3 LDA 主題分析結果

3.3.1 專利文獻

通過Python 并結合專家意見對主路徑分析提出的70 條專利數據進行主題提取。首先對專利數據的標題、摘要以及說明書內容進行整理,形成文本信息并進行預處理,然后計算得到困惑度確定專利文獻最優主題數為14 個(見圖4);利用Python 的jieba 工具包進行分詞后,根據確定的最優主題數量,利用LDA 主題模型進行主題生成,設置每個主題的詞匯數量為12 個,最終得到14 個主題的主題詞。專利文獻主題以及每個主題下的主題詞結果如表3所示。

表3 樣本專利文獻主題詞結果

圖4 樣本專利文獻主題數量與其困惑度關系

根據文檔主題的分布概率,將專利分配給不同的主題發現,有關領域內的應用研究最早是關于亞單位疫苗的相關專利,其次是關于各類病毒感染治療的疫苗研發。隨著核酸相關研究的深入,治療或預防具體疾病的核酸疫苗及其相關載體的研發得以順利進行,近幾年更是研發出許多抵御新冠病毒感染的疫苗,保護了全球人民的生命健康。此外,近幾年有關癌癥疫苗的相關專利較少,這將會是未來基因工程疫苗領域的一大研究熱點。

3.3.2 科學文獻

重復上述方法確定科學文獻的最優主題數同樣為14 個(見圖5),最終得到14 個主題的主題詞,如表4 所示。

表4 樣本科學文獻主題詞結果

圖5 科學文獻主題數量與困惑度的關系

根據文檔主題的分布概率,將每篇文獻分配給不同的主題發現,科學文獻早期專注于對各類病毒疫苗的研究,后來同步拓展到DNA 疫苗以及RNA疫苗領域,經過十幾年的研究發現,RNA 疫苗相對DNA 疫苗更具安全性,故近幾年來有關RNA 疫苗的研究受到更多學者的關注;隨著研發的深入,mRNA疫苗的優勢得以顯現,特別是在新冠病毒感染疫情中mRNA 疫苗效果得到廣泛認可,因而最近有關基因工程疫苗的研究多圍繞mRNA 疫苗相關內容開展。

3.4 科技演化分析結果

基于LDA 主題模型的結果,并依據余弦相似度計算公式來計算主題之間的相似程度,獲得樣本科學文獻與專利文獻相似度矩陣。為了使結果更為客觀,通過調試最終確定0.45 為相似度閾值,認定余弦相似度值高于0.45 的主題為相似主題,最終獲得5組相似主題:(1)T0與S8;(2)T5與S7;(3)T8與S2、S6;(4)T10與S1、S11;(5)T13與S5、S9。

基于上述結果,結合所構建的主題時間軸,將樣本科學文獻與專利文獻的相似主題根據LDA 主題模型提取出的主題詞共現詞頻進行連接,最終繪制基因工程疫苗領域科學與技術的演化關系圖(見圖6),其中線條的粗細代表共現詞頻的高低;不同深淺則代表不同主題。可以發現,科學文獻路徑主題的劃分較為集中,多為DNA 疫苗與RNA 疫苗相關研究;而專利文獻路徑主題較為冗雜,多為針對不同病毒或疾病的疫苗研究。這一點也符合我們對科學文獻多為基礎研究,而專利文獻多為應用研究的認知。

圖6 1995—2020 年基因工程疫苗領域科技演化模式

(1)T0和S8在內容上均是減毒病毒用于疫苗載體的相關研究。T0出現在2003 年左右,主要聚焦于重組減毒流感病毒的制備及其在生產疫苗和基因治療載體的應用;S8出現在2009 年及2022 年左右,研究通過密碼子去優化的方式對病毒高度減毒,用于開發安全、穩定的減毒活疫苗或疫苗載體。綜上,減毒病毒用于疫苗載體的相關研究中,主要是應用研究影響基礎研究,即技術影響科學的模式。

(2)T8和S2、S6均是RNA 疫苗的作用機制及其構建方面的研究。T8出現在2017 年左右,是人工核酸疫苗的構建即人工mRNA 疫苗的構建,及其在預防和治療介卡病毒感染方面的應用;S2出現在2021 年左右,是自擴增RNA 作為疫苗的優勢及其在抗感染領域的應用和相關遞送載體的研究;S6出現在1991、2006 及2010 年左右,是RNA 疫苗的作用機制和疫苗構建及其在癌癥領域的應用。可以看出,早期RNA 疫苗作用機制相關基礎研究影響應用研究,呈現出科學影響技術的趨勢,近幾年來有關基礎研究的文獻數量增多,再次呈現出技術影響科學的趨勢。

(3)T10和S1、S11涉及減毒活疫苗以及亞單位疫苗的相關研究與應用等內容。T10出現在1980、1993 和2000 年左右,是病毒亞單位疫苗的制備和應用以及重組負鏈RNA 病毒的生成及其在疫苗制劑中的用途;S1出現在1991 及1997 年左右,是減毒突變體的構建以及減毒活疫苗的開發;S11出現在2014及2020 年左右,是基于核酸亞單位疫苗的遞送載體以及減毒活疫苗的開發。2000 年之前,科學文獻與專利文獻交替出現,科學與技術呈現相互影響模式,之后技術逐漸促進科學的發展,越來越多的科學文獻誕生,呈現技術影響科學的模式。

(4)T13和S5、S9均是有關RNA 疫苗在其治療應用領域的研究。T13 出現在2018 年左右,是RNA疫苗的構建及其在各種疾病領域的應用;S5出現在2004 及2021 年左右,是關于mRNA 疫苗的發展優勢以及其在癌癥領域的應用;S9出現在2013 及2019年左右,是基于RNA 的疫苗較傳統疫苗的優點以及其在抗流感病毒方面的應用。科學文獻出現較早、專利出現較晚,先是呈現科學影響技術的模式,而近幾年又出現新的技術突破,顯現出科學影響技術的模式。

(5)T5和S7均是新冠病毒疫苗的研發相關研究。T5與S7均出現在2020 年左右,2019 年年末暴發了一場新型冠狀病毒感染疫情,科學家們緊急開展了相關科學文獻及專利技術的研究,并取得顯著的成果。可以發現在這一領域,科學與技術呈現明顯的協同共生、相互促進關系。

總的來說,基因工程疫苗領域大體上呈現為科學研究和技術應用相互促進的模式,基因工程的基礎技術發展促使基因工程疫苗可以應用于多種疾病領域,特別是抗感染領域。近年來科學家對腫瘤領域的基因工程疫苗進行了較深入研究,并產出了許多科學文獻,但由于腫瘤類型的復雜多樣及其作用機制的難以獲取,基因工程疫苗在癌癥領域的臨床應用仍然存在許多問題,相信基礎研究的快速發展定會為新型癌癥疫苗的研制提供新思路。此外,mRNA 疫苗是領域內一個新的研究熱點。近幾年來,越來越多的學者開始探討mRNA 疫苗技術,新冠病毒感染疫情的出現更是在全球范圍內提高了對mRNA 疫苗的認可度,可以預測,未來mRNA 疫苗將被廣泛用于癌癥疫苗免疫領域,成為基因工程疫苗領域的研發重點。

4 討論與結論

本研究提出一種基于主路徑分析與LDA 主題模型相結合的方式來探索領域科技演化模式,并通過基因工程疫苗領域的實證結果證明了該方法的可行性及準確性。通過使用主路徑分析提取領域中核心內容,將主路徑分析與LDA 主題分析相結合,使用主路徑分析提取出基于時間軸的科學或專利文獻,并利用LDA 主題模型提取各自主題內容,分析科學主題與技術主題在時間上和內容上的互動關系,這樣一來,科學主題或技術主題更具代表性;同時,利用桑基圖的形式將科學層面與技術層面聯系起來,可以更加清晰地看出領域內科技演化模式。

然而,本研究僅從科學與技術兩個層面,在現有科學文獻或專利文獻的基礎上對基因工程疫苗領域內科技演化模式進行探索,無法預測未來新技術出現的時機;同時也僅采用了基于主題詞復現詞頻的方法,將處于不同時間段的相似科學主題與技術主題聯系起來。未來的研究可引入市場這一層面,借助計算機算法來深入挖掘領域內的技術發展特征。

猜你喜歡
科學研究
FMS與YBT相關性的實證研究
2020年國內翻譯研究述評
遼代千人邑研究述論
視錯覺在平面設計中的應用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
點擊科學
點擊科學
科學大爆炸
小小藝術家(2019年6期)2019-06-24 17:39:44
EMA伺服控制系統研究
新版C-NCAP側面碰撞假人損傷研究
科學
主站蜘蛛池模板: 扒开粉嫩的小缝隙喷白浆视频| 久久久久免费精品国产| 国产成人福利在线视老湿机| 波多野结衣第一页| 国产麻豆91网在线看| 亚洲国产成人精品青青草原| 日韩视频免费| 国产三级视频网站| 超清无码一区二区三区| 狠狠色狠狠综合久久| 国产精品白浆在线播放| 免费在线观看av| 亚洲国产综合精品一区| 免费黄色国产视频| 波多野吉衣一区二区三区av| 亚洲成人在线免费| 欧美日韩在线亚洲国产人| 999国内精品久久免费视频| 亚洲中文无码av永久伊人| 伦精品一区二区三区视频| 国产剧情国内精品原创| 亚洲午夜天堂| 92午夜福利影院一区二区三区| 中文字幕在线一区二区在线| 亚洲v日韩v欧美在线观看| 婷婷伊人五月| 97超级碰碰碰碰精品| 一本一道波多野结衣一区二区| 制服丝袜国产精品| 欧美精品亚洲二区| 欧美A级V片在线观看| 国产人成在线视频| 网久久综合| 一个色综合久久| 国产美女人喷水在线观看| 久久窝窝国产精品午夜看片| 亚洲一区波多野结衣二区三区| 91毛片网| 欧美国产中文| 激情五月婷婷综合网| 国内精品视频| 亚洲欧美日韩精品专区| 國產尤物AV尤物在線觀看| 免费a在线观看播放| 国产91丝袜在线播放动漫| 久草青青在线视频| 欧美精品成人| 日韩在线第三页| 久久99热这里只有精品免费看| 午夜国产不卡在线观看视频| 在线精品自拍| 广东一级毛片| 香蕉视频在线观看www| 国产精品永久久久久| 99久久性生片| 亚洲午夜综合网| 国产美女视频黄a视频全免费网站| 国产欧美日韩另类| 亚洲中文字幕精品| 午夜综合网| 在线观看国产黄色| 青青草国产在线视频| 国产乱人乱偷精品视频a人人澡| 国产91九色在线播放| 四虎永久在线精品国产免费| 亚洲精品波多野结衣| 欧美精品在线观看视频| 福利片91| 国产成人精品日本亚洲77美色| 在线观看视频一区二区| 国产原创自拍不卡第一页| 色噜噜狠狠色综合网图区| 伊人五月丁香综合AⅤ| 又爽又大又黄a级毛片在线视频| 日韩高清中文字幕| 2021天堂在线亚洲精品专区| 91精品专区国产盗摄| www.狠狠| 久久国产精品娇妻素人| 又爽又大又黄a级毛片在线视频 | 国产欧美日韩va| 精品撒尿视频一区二区三区|