陸菁宇,張紹陽,黃文旎
(長安大學 信息工程學院,陜西 西安 710064)
學科是高等院校教學和科學研究的基本構成單元,凝聚了一批高水平、高層次的科技人才,是大學進行人才培養、科學研究的重要依托。學科的科研水準反映的是一所高校的核心競爭能力[1]。對學科狀態進行分析,不僅可以讓科研機構明確認識到當前學科的長處和短板,幫助提升碩博士生的培養質量;同時也為外界了解高等院校以及科研機構學科內涵建設提供渠道。
教育部學位與研究生教育發展中心自2002年起對全國有授予博士或碩士學位資格的一級學科開展整體水平評估[2]。到2017年為止已經進行了四次,第四輪學科評估以“公共數據和單位填報相結合”的方式獲取數據,并且設置了“師資隊伍與資源”“人才培養質量”“科學研究水平”“社會服務與學科聲譽”四個一級指標及對應的二級指標。學科評估全面反映了學科的總體狀況,但由于學科評估是針對所有學科的,不會針對每個學科的內涵進行分析。
知識圖譜可以直觀清晰地展現科學知識的發展進程和知識結構關系[3],因此很多研究者將它應用在各自的研究領域。一方面可以利用知識圖譜挖掘學科領域的基礎知識,展現學科知識架構。例如,傅居正、喻國明使用知識圖譜對數據新聞學科進行研究[4]。廉同輝、余菜花、宗乾進使用知識圖譜對旅游學科研究領域、主要研究機構、學術代表人物進行探究[5]。吳遠仁研究2001-2017年間人口、資源與環境學科的核心研究領域[6]。另一方面可以通過知識圖譜找到科學知識的內在連接,并利用“圖譜”特征直觀呈現學科的發展規律和演化路徑[7]。例如,孫艷、田麗梅使用中國知網收錄的“中文核心期刊”和“CSSCI”相關研究文獻對輿情的研究現狀進行分析,總結文獻內在的聯系和科學結構[8]。張學召使用共詞知識圖譜探究材料學和工程學兩門學科的研究熱點、趨勢[9]。饒武元、劉浩使用共現知識圖譜對一流學科的科研熱點以及科研前沿進行分析[10]。當前采用知識圖譜對學科展開的研究主要使用的數據源是Web of Science和CNKI中收錄的期刊文獻,并且研究內容大多是對研究領域、發文量、領域經典文獻、研究熱點進行分析,而對于學科的研究技術、技術熱點和發展有所忽略[11]。科研過程中使用的技術直接反映了研究人員的科研水平和學科發展狀況,因此文中從研究技術的角度對學科的發展狀態進行探析。
交通信息工程及控制學科是“交通運輸工程”一級學科下的二級學科,也是現代交通運輸工程發展的核心學科,為國家輸送交通科技人才,對社會和國民經濟建設有重要的意義。當前尚沒有對交通信息工程及控制學科發展狀態進行分析的文獻。碩博士是高校科研的主力軍,其研究水平能夠從一個層面反映一個學科的水平,碩博士的主要產出即學位論文。學位論文能夠體現作者的基礎理論知識、研究領域、手段和成果,綜合起來就是一個學科的整體狀態。為此,文中以碩博士論文為分析對象,對交通信息工程及控制學科的發展狀態進行分析。探究該學科的科研技術熱點和科研現狀,探索該學科不同領域的科研技術熱點共性、科研趨勢等,為科研機構了解自身的科研水平以及確定該學科未來科研方向提供參考和借鑒。
學科評估是對一個學科的整體水平進行評估,對于評價學科建設的成效是一個重要的評價依據。在本研究中,選擇在《全國第四輪學科評估》中評估等級“B+”及以上的高校作為代表對該學科進行分析[12]。分別有:東南大學、西南交通大學、北京交通大學、北京航空航天大學、同濟大學、大連海事大學、哈爾濱工業大學、武漢理工大學、中南大學和長安大學。這幾所高校在該學科科研研究基礎深、具有較高影響力,可以反映出該學科真實的科研現狀。
文中以CNKI中該學科的碩博士學位論文文獻為數據。在高級檢索中的碩博士論文中設置檢索條件:學科專業名稱=交通信息工程及控制;學位年度=2009-2018;學位單位=上述高校其中之一。在檢索過程中,沒有檢索到同濟大學和北京航空航天大學相關的學位論文,因此經過篩選采用剩下八所高校檢索出的2 393篇學位論文作為研究樣本。具體發表數量分布如圖1所示。

圖1 2009-2018學位論文年度分布
如圖1所示,該學科的碩博士論文的發文量平均波動程度較小,并且整體呈緩慢下降的趨勢。總的來說,交通信息工程及控制學科碩博士論文一直維持著一定程度的發文量,反映出該學科的研究已經邁入一個比較成熟的研究領域。
將數據進行導出并完成數據格式轉換,如圖2和圖3所示。

圖2 數據格式轉換

圖3 數據處理前與處理后(部分)
知識圖譜區別于傳統的文字、表格,而是以網狀結構描述世界上的實體、概念以及實體與概念之間的關系,并且采用圖形化的方式使人們更加直觀地發現、理解這些信息[13-14]。知識圖譜可以針對某一學科專業領域的科學技術發展態勢及其相關知識結構進行深入研究,進而發現科技活動中潛在的一般和特殊規律,也使得管理人員可以有效監測學科發展動態,從而推動學科整體的發展。因為交通信息工程及控制學科相關高校的主要研究領域可分為公路交通、水路交通和鐵路交通三個領域。為了對學科有更加全面、深入的了解,按照相關研究領域構建圖譜。
知識圖譜的構建主要包括確定研究領域、數據檢索與清洗、圖譜構建與圖譜分析等步驟。具體如圖4所示。
(1)時間切片劃分。
將時間分區設定為1,則為每一年為一個時間分區,利用熵作為各時間段的宏觀指標來衡量網絡的有序性。

圖4 圖譜構建流程
(2)關聯強度計算。
圖譜中的節點顯示的是分析的對象,連線表示著兩個詞之間的共現聯系,連線的粗細則是表示著這種共現聯系的強度。知識連接強度的計算主要有三種方法:
(1)夾角余弦距離計算。
(1)
(2)Jaccard距離計算。
(2)
(3)Dice距離計算。
(3)
x,y:任意的兩個節點;
Cx:與x相連的節點構成的向量;
Cy:與y相連的節點構成的向量;
Cxi:x與i節點共現次數;
Cyi:y與i節點共現次數;
Cxy:x與y節點共現次數。
文中主要使用夾角余弦距離算法計算知識的連接強度。
(3)節點閾值。
數據量過多會造成圖譜過于龐大和雜亂,因此需要對節點設定閾值,對數據進行篩選,去除冗余信息使圖譜更加清晰。文中將閾值設定為TOP30,即將每個時間切片中頻次最高的30個節點數據作為繪制數據。
(4)網絡裁剪。
在數據量龐大的情況下,圖譜雜亂不宜解讀,需要進行網絡的裁剪使圖譜更加清晰簡潔。文中采用最小生成樹算法來對網絡進行簡化,即在網絡中,構建一個能夠包含所有頂點,無圈且權值最小的子網絡。
點的中心性是一個用以量化點在網絡中地位重要性的圖論概念。節點中介中心性的大小代表著這個節點與圖譜中其他節點的聯系密切程度,中心性高的點往往位于連接兩個不同聚類的路徑上[15]。中心性超過0.1的節點稱為關鍵節點。在citespace中對圖譜進行構建。
(1)公路交通領域研究技術熱點。
該學科的公路交通領域研究技術熱點知識圖譜如圖5所示。圖5中高中心性詞見表1。

表1 公路交通領域研究技術熱點高中心性詞

圖5 公路交通領域技術研究熱點知識圖譜
由圖5和表1可知,在該學科研究公路交通領域中常用的技術熱點有神經網絡、嵌入式系統、仿真、DSP、圖像處理、模糊控制、支持向量機。
(2)水路交通領域研究技術熱點。
該學科的水路交通領域研究技術熱點知識圖譜如圖6所示。圖6中高中心性詞見表2。
由圖6和表2可知,在該學科水路交通領域研究的技術熱點主要為航海模擬器、仿真、建模、模糊綜合評價、神經網絡、層次分析法。
(3)鐵路交通領域研究技術熱點。
該學科的鐵路交通領域研究技術熱點知識圖譜如圖7所示。圖7中高中心性詞見表3。

圖7 鐵路交通領域技術研究熱點知識圖譜

表3 鐵路交通領域研究技術熱點高中心性詞
自表3和圖7可知,該學科在鐵路交通領域主要的研究技術熱點有仿真、建模、遺傳算法、神經網絡、自適應控制、時間自動機、貝葉斯網絡、模糊控制、uppaal。
(4)知識演化路徑。
為了更好地總結交通信息工程及控制學科的研究演化路徑,文中對相關文獻進行時區分析。通過時間的演變來展示知識的變化的圖譜[16]。如圖8所示,以一年為間隔,根據各個階段內的連線,可以看出知識之間的演化關系。

圖8 交通信息工程及控制學科研究技術時區圖
圖譜中節點表示當前學科熱點研究知識。點擊節點可以顯示與之相連的節點,展現知識之間的關系互聯,幫助研究者對知識進行分析。
(1)研究技術熱點分析。
由圖5和表1可知,在該學科研究公路交通領域中常用的技術熱點。通過圖譜可以發現,神經網絡技術主要包括BP神經網絡和卷積神經網絡。主要被用于交通流量預測、路面裂縫檢測、安全目標檢測等。嵌入式系統技術主要包括嵌入式系統和嵌入式Linux。主要被用于智能家居、車輛定位、移動目標智能檢測等。
仿真技術主要包括交通仿真和其他仿真。被用于隧道交通誘導仿真、語音識別仿真平臺等。DSP技術主要被用于車速檢測、智能車載抓拍系統等。圖像處理技術主要包括圖像處理、數字圖像處理等,主要被用于疲勞駕駛檢測、車牌定位、路面裂縫識別、干涉條紋檢測等。模糊控制技術主要被用于高速公路智能控制、監控系統控制等。支持向量機技術主要被用于交通流預測、交通事件檢測等。
由圖6和表2可知,在該學科水路交通領域研究的技術熱點。其中航海模擬器技術主要包括航海模擬器、拖輪模擬器、船舶操縱模擬器和海上搜救模擬器等主要被用于模擬真實場景以及模擬器性能的優化。仿真技術主要包括運動仿真、船舶交通仿真、三維仿真等。主要被用于船間效應仿真、雷達圖像仿真、船舶交通流演化、船只避碰仿真、海上立體搜尋態勢仿真。
建模技術主要包括建模、交通流模型、船舶運動數學模型等。主要被用于構建大規模地形場景模型、海圖要素建模、航向保持、動態路徑規劃等。模糊綜合評價主要包括模糊綜合評價、模糊綜合評判、粗糙集等。主要被用于智能避碰、溢油風險評價、安全評估、船員適任性評估等。神經網絡主要被用于船舶自動靠泊、船舶直線航跡控制等。層次分析法主要被應用于通航安全評價、船舶碰撞責任劃分輔助決策、船舶定線制優化等。
由圖7和表3可知,交通信息工程及控制學科在鐵路交通領域主要的研究技術熱點。其中仿真技術主要包括仿真測試、仿真平臺 視景仿真等。主要被用于CBTC系統測試、列車調度、列車自動駕駛、三維視景、等。建模技術主要包括uml、交通流模型、統一建模語言、模型轉換等。主要被用于車-地通信、車-車通信、車載設等。遺傳算法主要被用于節能運行、自動駕駛系統優化、交通流預測控制、故障診斷、交通事件檢測、交叉口信號控制、交通流預測等。
神經網絡主要包括BP神經網絡、小波神經網絡,主要被用于故障診斷、列車定位、信號智能控制等。自適應控制技術主要包括無模型自適應控制、魯棒自適應控制。主要被用于多列車協同控制、防滑牽引與制動數據驅動控制等。時間自動機技術主要被用于RBC控車、異常診斷等。模糊控制主要被用于車路協同、列車自動駕駛優化、交通信號協調控制、交通誘導、電機傳動控制系統的節能運行控制等。
(2)熱點共性分析。
對交通信息工程及控制學科不同領域的技術熱點進行研究分析,可以發現在不同的研究領域中,使用的研究技術是有一定的共性的。
仿真技術、神經網絡是三個領域的共性技術。BP神經網絡則是最高頻使用的神經網絡技術,其次是卷積神經網絡。建模技術為水路交通和鐵路交通領域的共性技術,建模經常與仿真技術一起使用,用來對列車或者船舶的設備、運行、通信等進行研究。模糊控制為公路交通和鐵路交通領域的熱點共性技術。模糊控制技術被用于信號協調控制等。
(3)發展演進分析。
圖8顯示了該學科研究技術發展的歷程。可以看出,該學科的博碩士生在科研過程中使用的技術種類多樣化。
圖8整體呈三角形,隨時間的變化,技術由淺入深。如使用頻次最高的仿真技術,從最開始的仿真到三維仿真、視景仿真。神經網絡技術,從一開始的神經網絡到BP神經網絡、小波神經網絡和卷積神經網絡。神經網絡有能力學習和構建非線性的復雜關系模型、高速尋找最優解。通常被應用在流量預測、目標識別、信號控制等方面。
嵌入式系統從嵌入式、Linux到嵌入式Linux,并且出現了專業的嵌入式軟件scade。各類機器學習算法,如蟻群算法、支持向量機、貝葉斯網絡等也隨著機器學習的發展在研究中使用。控制技術也在不斷發展,隨著研究的深入以及技術的發展,也不斷出現在相關研究中。
隨著智能交通越來越熱門,智能交通有關的技術也一直在深入,出現了車聯網技術以及相關的車-地通信技術和車-車通信技術等實現車路協同、人車交互。
整體來說,該學科的研究技術類別多樣化,并且出現的新技術呈逐年深入的狀態,說明該學科的研究已經步入一個較為成熟的階段。
以CNKI數據庫中2009-2018年間交通信息工程及控制學科評估等級B+以上的高校碩博士論文文獻為數據樣本,構建該學科知識圖譜,并對圖譜進行探析,結論如下:
(1)當前學科科研過程中使用的研究技術種類比較多樣化,主要是計算機技術、控制技術、通信技術。并且三個領域在科研過程中使用的技術有一定的共性,都使用了仿真技術和神經網絡。
(2)因為學科的發展以及科研的深入,相關技術也在不斷的發展。由時區圖可知,各類機器學習算法不斷改進,深度神經網絡的不斷深入,機器學習成為該學科的科研趨勢。在發展“智能交通”的大背景下,各類通信技術在進步,云計算技術也在升級,使得車聯網技術也成為未來的研究趨勢。