李乾瑞,郭俊芳,朱東華
(1. 北京理工大學 管理與經濟學院,北京 100081; 2.北京理工大學 信息與電子學院,北京 100081)
當前,技術創新已經成為我國提升核心競爭力、建設創新型國家的根本選擇。企業作為技術創新的主體,如何在新興技術產業研發與應用中占得先機,實現彎道超車,對于企業乃至國家推動創新發展,贏得發展主動權具有重要的戰略意義,已成為當前研究的熱點。為此,本文嘗試深入文本層面對新興技術專利數據進行挖掘,分析新興技術演化路徑并識別未來可能的技術機會,這對于企業推進技術創新和研發決策具有重要的理論研究價值和現實指導意義。
SAO (subject-action-object, 簡稱SAO) 語義分析方法作為一種新興的研究方法。2004年,由Verbilsky將其引入到TRIZ理論中,并結合文獻計量方法提出了“語義TRIZ”模型[1]。該方法作為語義TRIZ的核心技術,在國內相關研究較少。其主要強調“關鍵概念”,在提取文本信息中“主語-謂語-賓語”結構的基礎上,通過分析獨立詞組Subject(S)和Object(O)及其附近動作Action(A)的語義,來識別獨立詞組之間的關系。其中,如果主語S和賓語O代表系統的組件,A可以用來描述這些組件如何實現功能[2-3]。同時,如果謂語A和賓語O組合起來形成作用概念,代表需要解決的問題,那么主語S往往代表解決該問題的技術方案[4],這樣SAO結構就能形成一個問題-解決方案模式,進而反映文檔中特定的關鍵發現。
相比于傳統的基于關鍵詞的分析方法,SAO分析方法保留了關鍵詞之間的語義關系,能更深入地剖析獨立詞組間的內在聯系,在一定程度上確實能夠挖掘出文獻計量、引文分析等常用文獻分析方法所忽視的信息,為學者提供技術研究、關系識別、趨勢預測和相似度測量方面更詳盡和準確的信息。因此,SAO方法可以很好地用于識別關鍵問題的解決方案。當前,該方法主要應用于技術機會識別和專利相似度分析[5]。技術機會識別方面,Janghyeok等提出了從專利信息中自動識別TRIZ趨勢的方法[6];Sungchul等利用專利的SAO結構來進行技術規劃[7];JoséM等將技術挖掘方法和語義TRIZ方法相結合,實現了技術趨勢的快速甄別[8];郭俊芳等將SAO結構分析引入到技術路線圖的構建中來識別技術機會[9]。專利相似度分析方面,Sternitzke等運用SAO結構測量專利文檔的相似度,并將該方法與文獻計量方法、共引用分析、共詞分析和自引用關聯四種方法進行了對比[10];Janghyeok等通過計算專利的SAO結構相似性來探討專利的相似性,進而通過專利語義網絡來識別技術發展趨勢[11];Gerken等提出了基于SAO分析的高創新度發明識別方法[12];Janghyeok等利用專利SAO結構構建動態專利地圖來識別技術競爭趨勢[13];Park等利用SAO結構計算語義相似性,并結合語義TRIZ的“Reason For Jump”原理識別了可進行技術轉移的潛力專利[14]。
為此,本文提出運用SAO語義分析模型來開展解決新興技術產業重大研究問題的技術方案識別研究,并以染料敏化太陽能電池(DSSCs)技術為實證案例,證實了該方法的可行性和有效性。
為有效識別未來有潛力的技術創新方案,發現技術機會,本文從領域關鍵問題出發,深入文本信息內部,引入SAO結構中的“問題-動作-解決方案”模式,提出了基于SAO語義挖掘的關鍵問題-解決方案演化路徑識別模型。該模型層層深入,首先,在識別關鍵問題的基礎上,通過主謂賓關系,識別關鍵問題解決方案。其次,為進一步辨析未來有潛力的技術創新方案,將技術路線圖思想引入,通過展現技術方案的演化脈絡及關聯的方式,識別技術機會。該模型包括識別熱點技術問題、挖掘面向問題的技術解決方案、追蹤技術解決方案演化路徑、識別創新解決方案和技術機會四個步驟,具體流程如圖1所示。
本部分采用文獻計量法進行技術領域關鍵詞識別和統計,通過詞性標記識別出可能的領域熱點問題或主要研究目標(后文稱“關鍵問題”),再結合市場調研和專家智慧對現有關鍵問題集進行修正,該過程將文本挖掘結果和專家智慧相結合,二者互補。文本挖掘分析結果一方面可以降低對領域專家的素質要求和依賴性;另一方面,還可以彌補專家未考慮到,而潛在在數據背后的關鍵研究問題。本研究中識別關鍵問題的過程如圖2所示,其中關鍵詞識別和熱點問題分析采用VantagePoint 軟件實現,具體過程如下。

圖1 基于SAO語義分析方法的技術機會分析方法框架
1.制定檢索策略并獲取數據,構建領域數據集。確定研究主題,選擇合適的期刊數據庫作為數據源,制定檢索策略并下載,旨在獲取所有與研究主題相關的期刊數據集,構建專題數據庫(TD)。
2.分析數據并確定領域熱點研究問題。考慮到標題和摘要是文章的兩個核心部分,包含了文章的主要內容及創新點。因此,本文選擇領域數據的標題和摘要進行文本信息提取。首先,借助Search Technology公司的VantagePoint軟件進行自然語言處理,提取領域高頻詞,并通過數據清洗得到領域研究熱點詞匯集。其次,依據熱點詞匯的詞性和語義,人工識別表征技術問題或目標的關鍵詞,在結合專家知識的基礎上確定領域研究的熱點問題(P1,P2,P3,……),并分別以關鍵詞集(PK11, PK12; PK21, PK22, PK23; ……)來體現。
3.基于關鍵詞集構建各熱點研究問題的子數據集(PD1,PD2,PD3, ……)。本步驟的主要目的是為每個關鍵問題篩選出對應的文獻集。具體做法是將關鍵問題的各種表達形式作為檢索策略,篩選數據,進而構建各研究問題的子數據集。通過對數據集的分類,一方面,可以有效地減少不相關數據,降低SAO結構提取的數據量,提高分析效率;另一方面,可以通過關鍵詞識別的方式,將與熱點研究問題無關的記錄去掉,提高技術方案獲取的準確性,增強可行性。
本部分的目的是通過SAO語義挖掘方法識別問題-技術方案對,進而為技術方案演化路徑提供數據支持。面向問題的技術方案可以是新材料、新技術或新技術組合等。技術方案識別主要包括兩個步驟。
1.提取SAO結構。在識別出領域關鍵問題集的基礎上,借用Stanford Parser軟件從文獻集中提取SAO結構,其中,S和O提取效果的好壞直接影響后續的分析。SAO結構的提取可以借助Stanford Parser軟件和Goldfire軟件,經使用證實:Stanford Parser軟件部分功能是免費開放的,可以輔助識別句法結構,但開放軟件不能直接實現SAO結構提取;Goldfire軟件可以提取SAO結構并開展進一步的分析,但缺點是提取的SAO結構不能導出,并且SAO結構提取準確性有待考證。因此,本文采用團隊自行研發的SAO結構提取軟件,該軟件實現了詞組的提取。在提取SAO結構的基礎上,借助實驗室團隊開發的thesaurus進行同義詞和同義SAO結構合并(Zhang和Guo, 2013),最后對SAO結構進行人工核實。
2.識別技術方案并進行分類。在問題-解決方案模型中,問題確定后,AO就是固定的,因此重點是識別對應的S來確定關鍵問題對應的核心技術點。具體基于SAO結構識別核心技術點的過程如圖3所示。在識別技術方案的基礎上,本文建立技術方案對應文獻集,嘗試基于文獻關鍵詞共現確定文獻聚類,進而得到技術方案類別。在結合方案聚類結果和技術背景知識的情況下,實現對技術方案的分類。

圖2 識別關鍵問題的方法流程

圖3 基于SAO語義分析的技術方案識別
在識別出問題-解決方案對的基礎上,本部分進一步識別技術方案間的演化關系,并利用技術路線圖方法將技術演化路徑可視化。
1.確定技術演化路線圖的形式并定義節點。新技術、新材料或新方法都可以稱為面向問題的解決方案??紤]到不同的技術方案是作用于不同的產品部件,為更好地展示技術方案類別及關系,本文的技術演化路線圖的形式為:橫坐標是時間,縱坐標是技術方案的類別,每個節點是各技術方案。由于此處技術方案是通過SAO三元組進行識別的,所以技術方案往往是能代表完整語義的詞組或短語組合。具體該技術路線圖的形式如圖4所示。
2.確定各節點的位置,分析節點間的演化關系,最終完成技術方案演化路線圖的繪制。技術路線圖繪制的主要內容包括;節點的內容及位置、節點間的關系確定。技術路線圖的節點是面向特定問題的各技術解決方案,節點的橫坐標是由該技術方案所在文獻發表的時間確定,縱坐標是由該技術方案所屬技術類別來確定。節點間的演化關系是依據文獻摘要中提取的SAO結構語義來判斷。如果文中提到技術方案2是在前人技術方案1的基礎上(依據參考文獻)提出來的,則技術方案2和1之間有有向連線;如果技術方案2是在多個技術方案基礎上提出來的,則選擇離其最近的同技術類別的技術方案進行連線;如果文中并未提到其他技術方案,則該技術方案與其他技術方案沒有連線(如圖4所示,紅色圈中的節點即為此類技術方案)。最后,我們借助專家知識,進一步對技術方案間的演化關系進行修正與補充。
面向問題的技術方案演化路線圖直觀地展示了技術方案的演化路徑及功能類別,對技術研發人員和企業決策者宏觀把握問題-解決方案發展脈絡具有重要意義。面向問題的技術方案演化路線圖主要回答以下幾類問題。
1.特定技術領域核心的研究問題/技術目標有哪些?
2.解決特定問題的技術方案有哪些?各技術方案是作用于何部件?技術方案間是如何演化的?
3.技術方案是什么時間由哪些國家的學者提出的?不同國家研究重點及趨勢如何?等問題。
染料敏化太陽能電池技術作為第三代太陽能電池,由于其原材料豐富、低制造成本和制作工藝簡單等優勢,成為未來有潛力的新興技術。因此,本文選擇DSSCs技術開展實證研究,分析結果對新能源領域的技術研發規劃和產業政策制定具有重要意義。
1.本文以Alan Porter教授等學者所構建的DSSCs技術領域的檢索策略為依據[15],基于研究技術發展路徑的實際需要,選擇基礎研究數據庫SCI-Expanded作為數據源,數據檢索年份跨度為1981-2014年,文獻類型為Article,共得到期刊文獻有效數據7884條。
2.運用Search Technology公司的Vantage Point軟件對數據進行關鍵詞提取,發現排名前四的問題類關鍵詞及其詞頻為:Conversion efficiency (551);LOW-COST (315);PHOTOVOLTAIC PERFORMANCE (143);STABILITY (111)。本實證部分選擇conversion efficiency作為領域關鍵問題,分析與挖掘提升DSSCs電池轉化效率的各技術方案。
1.利用Stanford parser 軟件對7884篇文章進行SAO 結構提取,通過固定SAO結構中AO(提高轉化效率)的方式,篩選得到303條SAO結構,經人工修正后最終得到有效SAO結構227條,具體SAO結構篩選過程見表1。其中,SAO結構中的O為conversion efficiency,A為編號5中的動詞,該動詞列表是在Stanford Parser軟件詞性標記的基礎上,提取并統計詞性為VB/VBN/VBZ/ VBD/VBG,且能表達轉化效率提升含義的動詞。

圖4 面向問題的技術方案演化路線圖的形式

編號SAO結構篩選過程數量1下載到的期刊文獻78842包含conversion efficiency的文獻30563提取SAO結構,篩選包含conversion efficiency的SAO結構37204篩選代表電池整體轉化效率的SAO結構(包含overall conversion efficiency、cell conversion efficiency、photoelec-tric conversion efficiency)4055篩選問題為“提升轉化效率的SAO結構(action(A)為Improve、enhance、increase、achieve、yield、found、reveal、a-chieve、attain、provide、obtain、exhibit、result in)3036修正(人工合并相近SAO結構)227
2.在步驟1得到的227條SAO結構(如表2 所示)的基礎上,通過分析與“AO”結構串連接的“S”,可以得到提升電池轉化效率的關鍵技術(或技術解決方案)。
3.通過對227條SAO結構進行分析得到提升電池轉化效率的技術方案。而調研發現:DSSCs包含半導體光陽極、染料敏化劑、電解質溶液、對電極四個部件,故依據非正式專家意見和聚類分析結果,我們最終將關鍵技術方案按所屬部件進行分類。鑒于關于半導體光陽極的研究較多,我們結合調研結果和專家知識,進一步將半導體光陽極單獨進行分析,并從對光陽極的改進方式入手,將提升電池轉化效率的技術方案劃分為表面處理、復合結構、摻雜技術、改變微觀結構、TiO2制備方法和新材料研發六大類,具體見表3所示。此處,技術方案分類有助于決策者直觀地看出各技術方案所屬部件及采用的改進方式,更好地理清各技術方案間的關系和脈絡,支持決策。
為進一步分析提高DSSCs光電轉化效率的各技術解決方案,了解解決方案隨時間的演化過程及關系等,作者引入技術路線圖的概念,按照上表3的技術方案分類及對應的SAO結構,構建關鍵問題-核心解決方案的技術路線圖,進而更加直觀、深入的分析和識別新興技術的發展路徑。本部分僅選取部件光陽極為例,展示核心部件的技術方案演化路徑,如圖5所示。其中,各節點的形狀代表國家,不同的節點形狀表示該技術方案是由不同國家的學者提出來的。

表2 提升DSSCs整體轉化效率問題的SAO結構示例(8/227)

表3 關鍵技術方案分類表
光陽極材料作為影響DSSCs電池轉化效率的重要組成,相關學者圍繞光陽極開展的研究較多。我們分別對表面處理、復合結構、摻雜技術、改變微觀結構、新材料研發五類技術進行單獨分析(圖5),可以發現如下五條路徑。
1.表面處理方式:表面處理是提升電池光電轉化效率的有效方式。因此,許多研究學者開展表面處理相關的研究來進行光陽極薄膜性能的改進。具體包括:treating TiO2with pyridine derivatives, “TiCl4,”“metal hydroxide,”和“3-aminopro pyltrime thoxy silane (APTS)等。當然,一些新的混合物,如“TiCl4”“Nb2O5”“MgO”“HCL”“g-C3N4”等,也可用來對TiO2薄膜進行表面處理來提升TiO2薄膜的性能。
2.TiO2復合結構:包覆結構在提高光陽極材料性能方面顯現出明顯的優勢,包括:CaCO3、SiO2包覆TiO2結構等。具體的研究演化路徑如下:bilayer nonporous(2001)TiO2nanorod (2004)rough TiO2spheres(2007)Surface-passivated TiO2nanotube arrays(2008)LbL technique(2009)TiO2-B NBs(2010)BTs and PCTs nanotube arrays(2010)TiO2-NSs/graphene(2011)。
3.改變TiO2微觀結構來提升電池光電轉化效率:與復合結構相類似,改變TiO2微觀結構也可以影響電池整體效率。TiO2的微觀結構包括TiO2顆粒大小、厚度、性質和孔隙度等。為提高電子傳輸壽命,減少載流子復合,納米管陣列、納米線陣列等一維傳輸結構漸漸受到各國學者矚目。
4.在TiO2薄膜中摻雜其他物質進行光陽極薄膜性能改良:運用摻雜技術改進TiO2薄膜來提升電池轉化效率的研究較多。385篇文獻中都提到了TiO2摻雜技術,其中166篇文獻提到了提升電池轉化效率??傮w來說,用于摻雜的材料包括離子、原子和半導體化合物,如:Ag-TiO2、ZnO coated TiO2nanoparticles、Nd-doped TiO2、La-doped TiO2、N-doped TiO2、BaCO3-modified TiO2、N-F-doped TiO2electrode、Mg-doped ZnO、 Zn,N-TiO2、Second metal oxide (MgO, ZnO, Al2O3, or NiO) doping technology等。
基于路徑④,我們可以發現一些新的解決方案往往是多種方法的綜合。例如:Zn-N-doped TiO2electrodes (2011) 是在 N-doped TiO2(2009)的基礎上再摻雜Zn;ZnO nanorod arrays with Al3+(2013) 是Al3+-doped TiO2和改變TiO2微觀結構兩種方式的結合。此種將多種技術改進方法相結合實現互補也是未來技術發展的趨勢。
5.除了TiO2光陽極以外,ZnO、Al2O3、Nb2O5、SnO2、NiO等其他寬帶隙半導體光陽極材料也引起學者重視,成為未來替代TiO2的選擇。為進一步提升電池轉化效率性能,學者在新材料的基礎上,進一步通過改變材料結構和使用摻雜技術等來實現性能的提升,這些技術方案包括:ZnO coated with Ga, sheet-sphere ZnO, ring-and flower-structured ZnO, hierarchical ZnO nanorod, and hierarchical ZnO nanourchin等。其他技術方案包括用SnO2film treated with water vapor, using tri-layer film structure, Al2O3/NiO, aluminum oxide, graphene composite material, hierarchical SnO2and composite material做光陽極等。
1.提升電池轉化效率的技術方案分析
半導體光陽極材料是各國學者研究的重點,其中運用摻雜技術改進TiO2薄膜改進的研究較多。包括:ZnO coated nanoparticles、Nd-dopedTiO2、La-doped TiO2、N-doped TiO2、Zn,N-TiO2、second metal oxide (MgO, ZnO, Al2O3, or NiO)等。除摻雜技術外,為提高電子傳輸壽命,減少載流子復合,納米管陣列、納米線陣列等一維傳輸結構也漸漸受到各國學者矚目。同時,包覆結構也顯現出其明顯的優勢,如CaCO3、SiO2包覆 TiO2結構等。除了TiO2光陽極以外,ZnO、Nb2O5、SnO2等其他寬帶隙半導體光陽極材料也引起學者重視,成為未來替代TiO2的選擇。
2.不同國家研究重點及趨勢分析
各國研究者就電池轉化效率問題開展了大量研究,半導體光陽極材料的選擇和處理是影響電池轉化效率的重要因素,主要國家集中在中國、韓國、美國、日本、臺灣地區等。其中,2005年前,太陽能電池的研究還較少,處于起步階段;瑞士、美國、日本和以色列等國專家從不同的角度,提出了提升電池轉化效率的技術解決方案,主要包括:通過改變TiO2薄膜的結構和管長壁厚等、摻雜Sn/Zn氧化物等、TiCl4表面處理等來提升光陽極的電子收集和傳遞能力,進而提升電池轉化效率,具體方案包括:10-25 nm in thickness、ZnO coated TiO2nanoparticles、SnO2/TiO2composite cell、TiCl4treatment等。從2006年開始,圍繞太陽能電池轉化效率的研究逐漸增多,對半導體光陽極材料的選擇與處理也多樣化,主要以中國和韓國的學者為主,其次是日本、臺灣地區、美國等。中國也正是從2006年開始對DSSCs的研究逐漸增多,成為DSSCs研究的主力,中國學者發表的文獻數量占DSSCs領域總文獻數量的近26%,在提高電池轉化效率研究方面占總量的近一半。
以上分析結論,作者通過對DSSCs領域的文獻綜述閱讀和2015-2018年的文獻數據兩種方式進行了驗證,實證結果中對技術方案及其演化路徑的宏觀分析與判斷基本符合領域實際,故驗證了本文分析方法的可行性和有效性。

圖5 光陽極提升電池轉化效率的技術演化路徑圖
本文以語義TRIZ 理論為指導,在提取文獻標題及摘要中的SAO結構的基礎上,識別解決新興技術產業重大研究問題的技術方案。同時,借助非正式專家意見對技術方案進行功能屬性劃分,并結合技術出現時間,構建了縱坐標為不同部件技術解決方案的技術演化路徑圖,進而來識別解決領域關鍵問題的各技術方案及其關聯關系和演化路徑。最后,作者將該方法應用于DSSCs進行了實證探索,證實了該方法的可行性和有效性。
該方法主要具備兩大優勢,在方法層面,將SAO結構分析創新性地引入到技術演化路徑識別當中,依靠SAO結構在主-謂-賓關聯度揭示方面的優勢,實現了問題和解決方案的對應識別,彌補了基于關鍵詞等常用文獻分析方法的不足,可為解決發明問題和深層了解技術解決方案演化情況等提供有效的數據支持。此外,本文雖僅選取一個技術領域為例開展實證研究,但本文提出的方法模型在不同的技術領域同樣適用。在實際應用層面,該方法不僅能為決策者提供某一問題的具體解決方案及演化路徑,也能提供各解決方案之間的關聯關系和各主要國家的技術研發重點及研究趨勢,這對未來推進新興技術產業突破、指導企業技術創新及研發決策等具有重要意義。
然而,本文方法也存在一定的局限性。一方面,該研究僅針對特定關鍵問題來進行挖掘,無法反映技術發展的全貌同時,SAO結構提取的準確性和規模直接影響到技術發展路徑識別的準確性和可信性。另一方面,雖然摘要被認為是整篇文章中最具代表性和價值的部分,但由于簡短并不能完整反映整篇文章使用的所有技術和解決的所有問題,如果對全文進行SAO 結構提取,所得結果亦將更具說服力。這些都是未來有待進一步深入研究和改進的問題。