馬蘭夢,袁 飛,李 瓏
(中國科學院武漢文獻情報中心/科技大數據湖北省重點實驗室,湖北武漢 430071)
2018年和2019年,我國的中興通訊股份有限公司和華為技術有限公司分別被美國政府明令“斷供”,即禁止其購買敏感產品或需獲得有關許可方能購買與轉讓,其中涉及最多的是芯片相關技術。“中興事件”新聞在網上廣泛報道熱議后,《科技日報》首版頭條強勢推出新專欄“亟待攻克的核心技術”,開篇以“是什么卡了我們的脖子”為引題,報道了中國在高端芯片制造所需要的頂級光刻機方面的落后狀況[1]。芯片產業是現代信息社會的基石,光刻技術是芯片的制造工藝。光刻技術是利用光化學反應原理和化學、物理刻蝕方法,將掩模板上的圖案傳遞到晶圓的工藝技術[2]。美國等西方國家在芯片光刻等領域對我國實施的一系列禁令,使我國國人深刻認識到不掌握核心技術就容易被“卡脖子”,威脅企業存亡,威脅國家經濟安全[3]。
針對迫在眉睫的“卡脖子”難題,我國學者開展了一系列針對其發生機制與解決對策的理論研究,如肖廣嶺[3]從“卡脖子”技術和顛覆性技術結合的角度開展研究,陳勁等[4]從識別框架、戰略轉向與突破路徑的角度開展“卡脖子”技術的破解研究,楊柳春等[5]對高福院士進行采訪,、楊玉良[6]則從“卡脖子”與“卡腦子”的關系角度進行了闡述,但基于真實數據挖掘、開展領域規律剖析的相關文獻則非常少見,而領域規律的分析有助于更好地理解領域發展特征,助力“卡脖子”問題的“解鎖”。領域規律分析方法很多,其中以文獻計量與知識圖譜為代表的情報學方法以其基于真實數據、剖析中肯深刻的優點而被普遍應用于多個學科領域研究熱點及科研產出情況的解讀以及趨勢預測,如劉龑龍等[7]將文獻計量應用于人工智能領域研究現狀及熱點分析,李燕等[8]將知識圖譜分析應用于國際閱讀能力研究發展態勢等等,但目前國內尚未見采用情報學方法研究“卡脖子”問題的文獻。
本研究將藉由文獻計量與知識圖譜這兩大情報學分析手段,進行情報學在“卡脖子”領域研究的探索,并初步建立起“情報學分析→‘卡脖子’領域發展特征→多層面啟示”的“卡脖子”問題情報學研究模式(見圖1)。在該模式中,通過文獻檢索來獲得某特定“卡脖子”領域的文獻樣本,借助文獻分析工具得到發文量年度趨勢、國家(地區)以及機構排名與年代、機構聚類和關鍵詞聚類與密度等文獻特征,并將這4類文獻特征與科研產出時序進程、科研地位及時間嬗變、機構合作態勢和領域技術特征這4類“卡脖子”領域發展特征一一映射關聯,通過上述層層遞進的檢索、挖掘、分析、映射,歸納總結出“卡脖子”領域的總體發展方向、未來趨勢走向、競爭合作傾向和技術布局導向等“四向”啟示。本研究采用德溫特數據分析(Derwent Data Analyzer,DDA)和VOSviewer等分析工具,鑒于芯片制造“卡脖子”問題的嚴重性和緊迫性,選取光刻領域作為首次模式應用研究的案例。

圖1 “卡脖子”問題的情報學研究模式
本研究選取科學引文索引(Science Citation Index Expanded,SCIE)作為文獻樣本采集的數據庫,因其是國際公認的較客觀的權威論文索引庫,又是針對科學期刊文獻的多學科索引數據庫,可以很好地覆蓋光刻這一涉及多學科的技術領域。Derwent Data Analyzer系 Web of Science 的母公司科睿唯安開發的桌面數據挖掘平臺,能進行靈活的數據清洗,具有矩陣分析的獨特功能,可以結合不同字段對文獻信息進行多角度的分析,如趙寧等[9]針對仿人機器人領域進行了DDA專利分析挖掘。VOSviewer 是近年來知識圖譜研究的重要產物,其在圖譜展現,特別是共詞和聚類分析的可視化顯示方面占有獨特優勢,如王海焦等[10]基于VOSviewer開展了富血小板血漿研究熱點主題分析。DDA和VOSviewer兩種工具均能較準確挖掘文獻深層次規律,從而客觀科學地揭示相關領域的發展特征。
采用關鍵詞檢索法,對SCIE 中1900—2020年的數據,用語種=English和文獻類型=Article 進行精煉,采用檢索式:TS=(mask NEAR/0 aligner* OR*lithograph* OR photoetch*)。結合芯片光刻領域文獻調研與DDA數據清洗的結果,排除噪聲,再對檢索出的網頁結果進行Web of Science 類別精煉,剔除醫學、生物學等與本研究主題無關的類別,排除2021年在線優先出版的29篇,最終得到發表于1961—2020年的46 037篇文獻。數據檢索及下載時間為2021年1月29日。為了保證數據的完整性,通過全文下載等途徑獲取了作者地址并拷貝到原始數據文件的C1字段下,從而補齊了部分SCIE文獻中缺失的國家(地區)與機構信息。
基于上述46 037篇文獻集合(以下簡稱“樣本文獻”),利用文獻計量學方法對全球光刻技術領域發文量、重點國家、高發文機構進行統計,采用DDA實施數據清理,建立發文量年代列表、“國家(地區)-年代”矩陣、“機構-年代”矩陣,并通過Excel軟件實施可視化呈現;編輯光刻領域敘詞表(thesaurus),對同義詞進行歸并梳理,利用共現分析法和聚類分析法對全球光刻技術領域的機構合作、關鍵詞分布進行剖析,采用VOSviewer 軟件繪制全球光刻技術領域科學知識圖譜,揭示光刻領域的機構聚類與關鍵詞聚類、密度。
科研產出時序進程代表科研產出隨時間的變化過程,它能概括反映領域的發展歷史與現狀,讓相關研究者“知過去、看今朝、望未來”,從發展規律角度獲取“卡脖子”的解決啟示。
姜軍等[11]在研究中提及光刻工藝肇始于20世紀60年代,晚于本研究的檢索起始年(1900年),故本研究范圍覆蓋了光刻領域發展自始至今的所有時序進程。圖2展示了光刻領域相關研究發文量年度趨勢,最早的相關文獻發表于1961年,與光刻技術的肇始時間基本一致,這證明了本研究檢索策略的精準可靠。
圖2顯示,1961—1990年光刻領域發文量處于起步階段,總體緩慢上升,1961—1973年每年發表不足10篇,從1974—1990年發文量由16篇增至193篇;1990—1991年,發文量實現了從193篇到482篇的劇增,藉由DDA對1990年與1991年數據的深入挖掘可以發現,關鍵詞數量從1 205個(1990年)增加到3 194個(1991年),所涉及的技術門類呈現爆發增長,此外,投入到電子束光刻、X射線光刻等技術門類的發文量也增加了一倍左右;1992—2001年發文量實現了穩步小幅增長;2002—2011年發文量呈現較快速增長,并于2011年達到峰值(2 427篇);自此以后,2012—2020年發文量呈緩慢下降趨勢。

圖2 芯片光刻領域科研產出時序進程
美國學者Foster[12]于1986年提出了S曲線模型,認為S 曲線可以用來表征技術發展階段,并進一步闡明技術發展的萌芽期、成長期、成熟期以及衰退期。S 曲線模型顯示,一項新技術的發展并非隨機發生,在新技術產生之初會存在一個緩慢增長的導入階段即萌芽期;經過這一階段之后,累計效用增長率開始不斷增大,該技術開始迅速發展,進入成長期;之后,累計效用增長率開始不斷減小,該技術進入成熟期;當該技術發展接近極限值的時候,其增長又會逐漸緩慢,最終無限接近于其極限,即衰退期[13]。從芯片光刻領域的發文量趨勢線來看,除了成熟期的增長率大于成長期這一差異以外,該領域科研產出時序進程與S曲線模型基本吻合,在經歷了1961—1990年的萌芽期、1991—2001年的成長期、2002—2011年的成熟期后,2012年進入衰退期。根據S 曲線模型預測,之后光刻領域的科研產出將逐步減少,直至抵達技術極限。
通過科研主體(國家/地區、機構)的排位及各自科研產出的時間變化情況,可以從主體競爭、產出積累及時序等角度發現“卡脖子”問題的解決啟示。
3.2.1 國家(地區)排名
對樣本文獻統計顯示,開展光刻技術研究的國家(地區)總數為105個。為避免重復記錄,選取DDA中的“國家/地區(第一作者)”字段進行發文量統計。在我國,祖國大陸和臺灣的光刻領域研究基本是獨立發展的,二者的發展特征存在可以預計的差異性,有鑒于此,對祖國大陸和臺灣的有關數據分別進行統計分析(以下中國數據未含臺灣省的數據)。論文數量排名前10位的國家(地區)如表1所示,其中美國的發文量為12 025篇,占論文總量的26.13%,在光刻領域論文發表數量上處于絕對優勢,獨立成為第一集團;第2位日本的發文量為5 365篇,不到美國的一半;中國名列第三,發文量為4 925篇,與日本差距不大、與美國差距較大。日本、中國、韓國、德國發文量均在3 000篇以上,構成光刻領域研究第二集團;中國臺灣、英國、法國、意大利的發文量均在1 000篇以上,構成第三集團。統計全球各國情況發現:北美(美國、加拿大)、西歐(以德國、英國、法國為代表)、東亞(以日本、中國、韓國為代表)等地區在光刻領域研究產出較多;在本研究的檢索范圍內,非洲、南美洲、中亞等地區的部分國家尚未發表相關論文。

表1 1961—2020年芯片光刻領域發文量排名前十國家(地區)
芯片光刻領域發文量排名前10位國家(地區)的年代分析展現了一定規律(見圖3)。一方面,各國(地區)開展研究的起始時間各有早晚:美國在1961年發表了第一篇文獻;英、法、德在20世紀60年代也發表了相關論文;日本在20世紀70年代開始發文;中國最早的SCIE論文發表于1984年。另一方面,各國(地區)的發文年度趨勢也有差異:在經歷了前期數十年的增長以后,美、日、韓、德在近15年左右的年度發文量均有不同程度的下降;而中國的發文量幾乎一直持續上升,直到2019年下降勢頭才初露端倪。同時,有一點值得特別注意,中國的總發文量雖少于美國與日本(見表1),但年度發文量分別于2011年和2017年超越了日本與美國,并在超越年份之后持續領先。

圖3 芯片光刻領域發文量排名前十國家(地區)年度發文數量趨勢
3.2.2 機構排名
在進行DDA機構數據清洗后,發現參與芯片光刻技術SCIE文獻發表的機構共8 999家,前10位機構的情況如表2所示。其中,美國占據3席;韓國、日本各占2席;中國占據1席,即中國科學院,其發文量位居全球機構首位。

表2 1961—2020年芯片光刻領域發文量排名前十機構
從前10位機構的年度發文量趨勢來看(見圖4),除了IBM公司在1964年率先開展研究,其余機構都在20世紀70年代或以后才有SCIE文獻記錄。作為發文量最多的機構,中國科學院在20世紀80年代出現SCIE論文收錄,2008年以來,中國科學院有大量相關文獻發表,遠高于其他前10位機構,從而奠定了中國科學院發文總量第一的地位。

圖4 光刻技術領域相關研究發文量排名前10位的機構發文數量年度趨勢
中國在SCIE科研產出上位列全球三甲,這主要得益于近十幾年來的大量論文產出。中國在光刻領域的論文發表起步較晚,年度發文量分別于2011年和2017年超越了日本與美國并持續領先;2019年之后,年度發文趨勢也開始向S曲線模型的衰退期逼近。從總體的科研積累來看,中國與美國的差距還是非常大,論文總量相差2倍多;中國科學院位列全球機構第一,然而美日韓等國占據了前10位機構的7席,中國僅中國科學院1家上榜。
科研主體的分立或集聚反映了相關技術發展時的合作態勢:合作疏散,對于“卡脖子”技術而言,可能意味著新的增長點;合作緊密,可能意味著打入科研集聚體的困難程度較大,故而需要內部動力來謀求發展。因此,機構的合作態勢將給“卡脖子”問題以啟示。
為了解芯片光刻領域主要機構的合作情況,將樣本文獻數據導入 VOSviewer軟件,選擇共同作者(co-authorship)分析選項和機構(organization)分析單元,選用適當閾值以使研究對象為發文量前100位的機構,得到了光刻領域發文量排名前100位機構共現知識圖譜(見圖5)。其中,連線的存在代表相連的機構共同發表過文獻;節點與字體的大小取決于該節點的權重。本研究選用引用權重(citation weights),即節點大小與引用次數成正比,以此來反映機構發文的總體影響力。中國科學院發文量(1 453篇)排名第一,但根據圖5中的節點大小判斷,其論文的引用權重卻不及麻省理工學院(829篇)、加州大學伯克利分校(705篇)和西北大學(400篇)等。原因可能有兩方面:一是美國機構的相關研究起步較早,在影響力相同的情況下,越早發表的文獻引用次數積累越多;二是美國機構的文獻影響力較大。
如圖5所示,VOSviewer軟件通過其算法將前100位機構分為了6個聚類,將每個聚類標記上編號,并用虛線方框進行框定。其中:

圖5 1961—2020年芯片光刻領域發文量排名前100位機構共現知識圖譜
(1)聚類1#包括了32個節點,全部為美國科研主體。該聚類是以麻省理工學院、西北大學、加州大學伯克利分校、IBM公司等為主的美國“校+企”合作集團,是規模最大、影響力也最大的合作集團。
(2)聚類2#包括了25個節點,包含22家歐洲科研機構以及新加坡國立大學、南洋理工大學以及印度國立理工學院。該聚類是以法國國家科學研究中心、英國劍橋大學、荷蘭特文特大學等為主的“校+所”合作集團,新加坡等亞洲國家的機構與歐洲機構合作較為緊密。歐亞合作集團的規模和影響力僅次于美國集團。
(3)聚類3#包括了14個節點,全部為日本科研主體。該聚類是以大阪大學、東京大學和日本產業技術綜合研究所等為主的日本“校+所”合作集團。
(4)聚類4#包括了12個節點,全部為中國科研主體。該聚類是以中國科學院、南京大學、中國科學院大學、中國科技大學、吉林大學、華中科技大學、復旦大學和北京大學等為主的中國“校+所”合作集團,中科院一枝獨秀,而其“盟友”的論文影響力相對較弱。中國集團不似美國集團的眾強紛列態勢。
(5)聚類5#包括了11個節點,全部為韓國科研主體,注意到韓國科學技術院是高校性質。該聚類是以韓國科學技術院、首爾大學和延世大學等為主的韓國高校合作集團。
(6)聚類6#包括了5個節點,全部為中國臺灣科研主體。該聚類是以臺灣大學、臺灣交通大學等為主的中國臺灣高校合作集團。
值得注意的是,6個聚類所包含的節點中,除了聚類2#覆蓋了歐洲和亞洲國家的機構,其余5個聚類均只包含某單一國家或單一地區內的機構。綜合來看,各國(區域)內部抱團現象嚴重,從而形成了國家內(區域內)的聚類機構群體,除歐洲國家與新加坡、印度開展了較頻密的洲際合作以外,其他科研主體均傾向于國內合作。因此可以認為,芯片光刻領域的國家(區域)存在較明顯的國家間(區域間)技術壁壘。而在我國,祖國大陸的主要機構和臺灣機構沒有一篇合作發表文獻,從一個側面表明海峽兩岸具備較大的合作空間和潛力,只是在機制與體制上需要探索一個恰當的合作模式,促進兩地芯片光刻領域發展共贏。
關鍵詞是論文研究內容的高度提煉,通過對論文的關鍵詞詞頻進行統計和共現分析,能有效得出當前該領域的研究熱點[14]。利用關鍵詞分析可以較準確掌握研究內容的核心與重點,從而描繪領域技術特征,并進一步從技術分支、技術融合、技術未來趨勢等角度給予“卡脖子”問題以啟示。
將樣本文獻數據再次導入 VOSviewer軟件,選擇關鍵詞分析選項中的共現分析選項,為呈現更具可觀性的圖譜,僅選擇共現頻次達100 次及以上的關鍵詞節點(以下簡稱“高頻關鍵詞”),符合條件的關鍵詞共410個。將單復數的關鍵詞進行合并,如“thin film”與“thin films”合并等,將表達同一意思的單詞或詞組合并,如“Si”與“Silicon”、“nanoimprint”與“nanoimprint lithography”等,之后進行數據清理,得到高頻關鍵詞267個(見表3),高頻關鍵詞共現聚類和關鍵詞密度分別如圖6、圖7所示。
通過表3看到,“光刻(lithography)”出現了9 605次,“制造(fabrication)”出現了6 794次,均遠高于其他關鍵詞,從一個側面可以反映出芯片光刻領域是以“光刻制造”作為主線來展開研究的。

表3 1961—2020年芯片光刻領域文獻高頻關鍵詞

表3 (續)
從圖6看到,VOSviewer 把高頻關鍵詞聚類后形成 6 類:

圖6 1961—2020年芯片光刻領域高頻關鍵詞共現知識圖譜
(1)聚類1#包括了93個節點,以光刻膠薄膜研究領域為主,又與納米光刻、表面聚合物、光刻陣列、自組裝領域少量交叉。突出的關鍵詞包括“薄膜”“膜””“生長、沉積等。該領域類別界限較模糊。
(2)聚類2#包括了55個節點,以納米光刻研究領域為主,又與光刻膠薄膜領域少量交叉。突出的關鍵詞包括“納米光刻”“納米粒子”“納米球”“金”等。該領域類別界限較清晰。
(3)聚類3#包括了48個節點,以表面聚合物研究領域為主,又與光刻膠薄膜、電子束光刻、光刻陣列、自組裝少量交叉。突出的關鍵詞包括“表面”“制造”“聚合物”等。該領域類別界限較模糊。
(4)聚類4#包括了46個節點,以電子束光刻研究領域為主,又與表面聚合物領域少量交叉。突出的關鍵詞包括“光刻”“電子束光刻”等。該領域類別界限較清晰。
(5)聚類5#包括了14個節點,以光刻陣列、自組裝研究領域為主,又與光刻膠薄膜、表面聚合物、原子力顯微鏡少量交叉。突出的關鍵詞包括“陣列”“納米結構”“自組裝”等。該領域類別界限較模糊。
(6)聚類6#包括了11個節點,以原子力顯微鏡在光刻方向的應用研究領域為主,又與光刻陣列、自組裝少量交叉。突出的關鍵詞包括“原子力顯微鏡”“納米制造”等。該領域類別界限較模糊。
通過高頻關鍵詞出現頻次、聚類并結合其密度(見圖7)分析,可以發現芯片光刻領域研究熱點集中于輻照(irradiation)、光刻膠薄膜(thin films)、硅(Si)、陣列(array)、納米(nanostructure,nanolithography,nanoparticles)、自組裝(selfassembly)、光刻聚合物(polymer)等方面,“光刻制造”這一主題主導著整個領域的發展方向;各聚類重疊明顯,體現出分支領域交叉重疊廣泛,光刻技術領域呈現多頭并進、融合發展的態勢。

圖7 1961—2020年芯片光刻領域文獻高頻關鍵詞密度
本研究通過情報學分析方法進行科研產出數據挖掘,建立文獻特征與“卡脖子”領域發展特征之間的映射,以芯片光刻領域為例,獲得了光刻領域總體發展方向、未來趨勢走向、競爭合作傾向和技術布局導向的啟示如下:
(1)總體發展方向與未來趨勢走向。光刻領域發文量趨勢線與Foster[12]定義的技術發展S曲線基本吻合,在經歷了1961—1990年的萌芽期、1991—2001年的成長期、2002—2011年的成熟期后,2012年進入衰退期。光刻技術發展六十余年,通過不斷創新,引領芯片行業進步,使得摩爾定律得以保持。然而任何技術都有其發展極限,光刻也不例外,光刻領域的科研產出目前處在了衰退階段,新興的芯片制造技術或將噴薄涌現,這意味著我國的芯片事業將遭逢一次“彎道超車”的良機。在傳統光刻技術一時無法突破西方封鎖的情勢下,我國應因時而動,敏銳發現芯片制造的新興顛覆性技術,曲線式實現“卡脖子”問題的解鎖。
(2)競爭合作傾向。從國家(地區)發文量來看,美國排名第一,占論文總量的26.13%,處于絕對優勢地位;日本、中國分列二、三。雖然近年來中國的論文產出已陸續超越日、美,但與美國等西方國家的知識技術積累仍不可同日而語。從機構發文量來看,中國科學院雖排名全球第一,但其論文影響力卻不及麻省理工學院等美國機構;且美、歐、日集團總體影響力高于中國集團,排名前10位的機構中,美、日、韓、歐占據絕大多數席位。在大國競爭激烈的芯片光刻領域,我國近年科研產出的趕超并未完全改變科技研發的劣勢地位。
同時,聚類分析顯示西方各個合作集團均具有國內(區域內)抱團傾向,國際合作遠少于國內共同研究,技術壁壘依國界而劃分,由此可見,國內合作與機構自身科研厚度的提升才是關鍵制勝之道。宏觀方面,我國應制定出臺促進科研機構合作的政策,激發創新體系活力與提供助力;中觀方面,我國幾大光刻科研產出機構應以中國科學院為龍頭,加強南京大學、吉林大學等核心機構緊密聯動,同時聯合更多企業和科研院所長期開展產學研合作,做強國內集團;微觀方面,各相關機構需加大光刻領域人才引進力度,并給予人才以最優待遇,為領域發展奠定人才基礎。另外,我國應學習和借鑒美國在光刻領域中的研究方法和科研成果,并充分了解日本、德國、韓國等國的研究經驗。此外,我國的臺灣省以一省之力位居全球第六,中國臺灣的科研機構合作集團是全球第六大集團,如果在海峽兩岸合作的機制體制上下足功夫,形成合力,我國的芯片光刻領域發展將大大獲益。
(3)技術布局導向。光刻研究體系龐大,分支領域紛繁復雜,這需要我國在多個基礎與應用學科領域著力投入,方能在高端光刻技術上有所突破。從光刻領域關鍵詞分析不難看出,光刻研究熱點包括輻照、光刻膠薄膜、硅、陣列、納米、自組裝以及光刻聚合物等方面,分支領域較多,且彼此之間界限大多較為模糊。與大多數“卡脖子”領域類似,光刻領域也是技術分支叢生并大面積重疊,技術發展仰賴于諸如數學、物理、化學等基礎學科,又依靠光源制備、光刻膠合成、光學透鏡制造等眾多應用技術。今天,我們很多所謂的‘卡脖子’技術其實也是‘卡腦子’,根子是基礎理論研究跟不上,源頭和底層的東西沒有搞清楚;我國基礎研究雖然取得顯著進步,但同國際先進水平的差距還是明顯的,對解決關鍵核心技術問題的支撐力度還存在不足[15]。針對芯片光刻領域的分支特點,我國應避免“短視”和“冒進”,在應用技術攻堅的同時,大力夯實基礎研究,解開“卡腦子”,才能解鎖“卡脖子”。
綜上所述,本研究從芯片光刻領域的情報學分析中獲得了我國芯片光刻事業發展的一些啟示:第一,重視科學的底層問題,基礎研究與應用開發兩手抓;第二,宏觀、中觀、微觀結合,在國內形成政產學研合力。我國傳統光刻技術發展,依賴上述兩條將得以進一步提升水平。同時,我國也要瞄準技術轉型機遇期,在革新到來前偵測技術迭代的可能性,提前占領高地,建設成為芯片研究與制造的強國。
本研究以芯片光刻領域作為案例,探索了情報學研究模式在“卡脖子”領域的應用,通過領域特征挖掘獲得相關領域發展啟示,為我國解決“卡脖子”難題開辟新的路徑提供參考。由于是首次探索,研究模式尚存在不少改良補充的空間,未來或可將引文分析、內容分析等更多情報學方法納入研究模式,并針對更廣泛的情報學研究對象,例如專利文獻等,開展分析工作,隨著情報學研究方法的發展來進行模式的更新迭代,準確貼合學科領域實際,實現模式的完整動態進化。