李子林,安源,姚冬冬,郭肖肖,李雪山
(中國鐵道科學研究院集團有限公司 科學技術信息研究所,北京 100081)
在全球數字化轉型浪潮推動下,數字技術和知識經濟迅猛發展,精準化情報服務、知識服務等成為領域創新、行業發展亟需的重要支持工具,人工智能、知識圖譜技術在企業情報服務中的應用也成為熱門趨勢[1-2]。因此,在數字化轉型的大背景下,我國軌道交通領域逐步開啟精準化情報服務、知識服務的研究和探索。當前,左榮欣等[3]對基于知識聚類技術的高速鐵路信息情報網站建設展開研究,并提出落地方案;李雪山等[4]融合競爭情報思維,設計并研發軌道交通專業知識服務系統,構建專題情報服務模式;劉峰博等[5]設計了融合大數據技術的城市軌道交通應急輔助決策系統,通過對北京城市軌道交通各類數據的自動化采集、整合與分析形成情報供應急業務決策參考。以上研究成果主要聚焦工具維度的知識服務實現,如網站或系統建設。然而,立足軌道交通行業科研創新、業務決策需求,涵蓋理論建構、實踐路徑的知識服務模式研究較少,無法在行業內形成有理論深度、標準化、可推廣的知識服務模式。
鑒于此,以軌道交通專業知識服務為切入點,首先運用知識管理理論、情報理論對軌道交通專業知識服務的發展脈絡、內涵進行辨析;其次,參照科研用戶需求完成對軌道交通專業知識服務模式的理論建構;最后,以“軌道交通專業知識服務系統”為案例,論證軌道交通專業知識服務模式的實現路徑,為后期相關理論研究和實踐業務的開展提供參考和指導。
作為一個綜合性應用性強的行業,軌道交通領域涉及的知識層面繁多、知識結構分散、知識獲取成本高、知識共享難度大。以“鐵路”這一細分領域為例,其包括:鐵路工程、機車車輛、通信信號、鐵路運輸、牽引供電等領域。其中,“鐵路工程”同“環境工程”“安全工程”“測繪工程”“土木工程”等學科領域存在內容交叉;“牽引供電”同“電氣工程及其自動化”“車輛工程”等學科領域存在內容重合。這種情況直接導致鐵路科研資源和知識成果呈分散式分布,增加了鐵路行業科研人員查找、利用和獲取目標資源的難度和成本。在傳統環境下,軌道交通領域科技情報服務主要遵循“被動服務”“等客上門”的服務模式,同時,科技情報服務的內容較為單一,主要包括專題信息代查代檢、專題研究資料匯編、專題咨詢報告撰寫等。然而,伴隨著信息的“指數級”增長,依靠人工的傳統科技情報服務無法根據科研用戶需求從海量信息中自動整合有效知識,形成高價值、知識性輸出以支持科研創新、業務決策,使科研人員陷入數據海量、知識難求的窘境。
軌道交通專業知識服務是在傳統軌道交通科技情報服務的基礎上發展而來的,是一系列內外部因素共同作用的產物。一方面,“數據驅動型”全學科研究范式的確立提升了行業、領域主體的數據資產意識和知識管理觀念。以海量數據為基礎,運用機器學習、強化學習等算法實現數據間關系(相關關系、因果關系等)的挖掘,完成知識單元提取和知識聚類,成為各行業、領域知識再造、數據賦能的重要任務[6]。另一方面,傳統的軌道交通科技情報服務在服務規模、內容時效性以及用戶滿意度等方面日漸式微。如何緊密貼合數字時代科研用戶信息利用需求和偏好,實現跨系統、跨平臺、跨數據庫的科技情報資源整合,并面向多類用戶提供精準化、定制化、知識化的情報服務,成為軌道交通專業知識服務模式創新的內生動力。
軌道交通專業知識服務作為一個組配概念,由“軌道交通專業”“知識服務”2個詞組構成。參照構詞法進行概念釋義,首先需要明確“知識服務”的內涵與外延,在此基礎上,對“軌道交通專業知識服務”的內涵進行界定。知識服務是信息服務的更高級形式,通過信息處理過程,提供問題解決方案所需的知識,最終實現知識價值產出[7]。從內容提供角度看,知識服務是經過資源整合后為決策制定提供幫助的知識,是有特定價值的知識;從問題解決角度看,知識服務是從用戶提出需求開始,經過相關處理,最終解決問題的一系列過程;從資源利用角度看,知識服務則是一種價值增值,實現從信息資源到知識的轉變[8]。綜上,該研究將“軌道交通專業知識服務”定義為:通過對軌道交通專業領域科技信息資源進行采集與整合,以人工智能、算法技術工具實現信息的深度組織與處理,形成附加值高、關聯性強、可組合拆解的領域知識單元,最終實現知識型產品、工具的輸出。
軌道交通專業知識服務的構成要素主要包括4個方面:(1)服務對象。即軌道交通行業內的科研主體、決策主體,包括組織機構和個人。其中,從事鐵路、城市軌道交通等細分領域科研工作的人員是軌道交通專業知識服務的主要服務對象。(2)服務內容。軌道交通專業知識服務的內容更趨向于海量數據、文獻集的內容挖掘和分析,包括關聯檢索、趨勢預測、成果評估、知識圖譜、專家系統等。(3)服務能力。相較于傳統科技情報服務,軌道交通專業知識服務的服務能力更高。按照知識服務的流程具體可分為:多源異構數據資源建設能力、知識組織能力、數據分析處理能力、知識傳播能力、決策支持能力、研究創新能力等。(4)服務輸出。軌道交通專業知識服務的最終目標是為組織決策、科研創新提供參考和支持,其最終產出為參考咨詢報告、專題知識產品和技術創新成果等。
軌道交通專業知識服務是在軌道交通專業情報服務的基礎上發展而來的,兩者在服務背景、處理對象、構建方式、處理能力、交互方式、服務形式方面存在顯著區別,具體見表1。

表1 軌道交通專業知識服務與情報服務比較
與軌道交通專業情報服務相比,軌道交通專業知識服務是信息與情報服務領域積極適應大數據和泛在知識環境發展的產物,其服務理念與技術環境變革聯系更加緊密,具備廣闊的發展前景和活力。從處理對象來看,知識服務處理的信息資源顆粒度更高,從傳統的文獻實體、內容碎片化的文獻轉向了海量、多源異構的數據集合,貼合“數據驅動型”研究范式的內在邏輯,為軌道交通領域數據價值再造夯實基礎。從構建方式和處理能力來看,知識服務延續情報服務依靠人工參與的低自動化構建方式,在此基礎上,運用智能模型、算法技術實現高度自動化、智能化的構建,在文獻內容處理能力方面取得質的提升。傳統情報服務依靠結構化查詢、人工經驗完成文獻內容的分析與挖掘。然而知識服務則依靠大規模計算能力、語義級別的檢索、自動分類標引、知識推理等完成自動化、規模化、知識化的文獻內容挖掘,最終實現提高效率、節約資源的雙重目標。
另外,知識服務依托線上系統可提供多并發用戶服務、即時性交流與反饋,優于傳統情報服務的“點對點”交流和延時反饋,有利于用戶滿意度的提升。在服務形式上,知識服務形式更為多樣,為用戶提供專題定制與研究跟蹤服務、智能推送服務、聯想詞檢索服務以及基于大數據的行業詞庫、領域知識圖譜等知識工具。與情報服務依靠人工展開的分析、綜述與評價形式相比,前者的多樣性、知識化更有助于激發用戶主動進行知識發現和創新的積極性。
軌道交通專業知識服務模式的確立有助于進一步提升軌道交通行業科技情報服務能力,為我國軌道交通科技創新工作提供驅動力。軌道交通專業知識服務模式具備4個方面的特點:(1)以用戶需求為導向。軌道交通專業知識服務模式強調知識服務的全流程,圍繞軌道交通行業機構、個人的科研和業務決策需求展開。從前期數據資源整合、組織到后期知識工具、知識產品輸出,均滲透著用戶需求導向的理念。(2)以系統平臺為依托。軌道交通專業知識服務模式離不開系統平臺建設,依托系統平臺推進多源異構數據的整合與加工工作,并面向用戶提供在線訪問和個性化的知識服務。(3)以數據整合為基礎。軌道交通專業知識服務模式在本質上仍隸屬信息服務的范疇,離不開數據資源的整合與歸集工作。跨系統、跨平臺、跨數據庫的多源異構數據資源整合是知識服務模式實現的基本條件。(4)以知識工具和產品為輸出。相較于軌道交通專業情報服務的文本型知識(咨詢報告、綜述、文摘等)輸出,軌道交通專業知識服務模式旨在輸出凝聚大數據技術特征的各類知識工具和產品,如領域知識圖譜、知識發現報告等。
以“軌道交通專業知識服務系統”為原型,可將軌道交通專業知識服務模式抽象為一個涵蓋資源層、業務層、服務層、用戶層的4級理論架構(見圖1),具體如下:

圖1 軌道交通專業知識服務模式理論架構
(1)資源層位于軌道交通專業知識服務模式的底層,主要承擔原始數據整合與存儲的功能。
(2)業務層上承服務層,下接資源層,主要負責對分布式存儲的各類數據資源進行清洗、篩選、規范格式等數據處理工作。同時,為加強多源異構數據的語義性和可計算性,引入機器翻譯、知識挖掘等技術工具,對數據進行翻譯轉換、知識抽取、內容相似度計算,為后期服務層各類功能的實現提供深加工的數據和技術支撐。
(3)服務層為軌道交通專業知識服務模式理論架構的核心層。服務層與用戶層直接關聯,主要面向不同類型用戶提供3種類型的知識服務:①專題定制。基于用戶檢索和利用行為數據,繪制用戶畫像,在此基礎上為用戶提供定題檢索、專題信息定制和持續推送服務。②知識工具。在業務層的支持下,結合鐵路領域知識分布、研究和業務決策需求,研制鐵路大數據詞庫、鐵路科技文獻自動分類標引工具、軌道交通專業聯想詞檢索系統、鐵路專業機器翻譯工具等知識工具,提升用戶利用科技信息開展研究、進行決策的自主能力。③智能情報。以自動化數據采集為基點,引入數據可視化分析工具和版式化模型,實現科技情報分析工作的智能化和簡約化,自動、實時生成領域研究熱點圖譜、態勢分析報告等知識產品。
(4)用戶層主要包括軌道交通領域的科研機構、科技企業和科研人員三類。不同類型用戶的需求直接影響知識服務的類型和內容,也以“倒逼”的方式影響著資源層的建設工作。
軌道交通專業知識服務模式的實現既需要理論架構的指導,也離不開機構業務實踐的探索。以“軌道交通專業知識服務系統”為例,可將軌道交通專業知識服務模式的實現路徑劃分為以下4個方面。
軌道交通行業的數據資源類別豐富,如期刊論文、會議論文、標準、專利、網站資訊、社交媒體平臺推送、機構內部文獻等。以上各類資源分布在多個系統、網站以及存儲介質上,增加了數據整合與歸集的難度。參考國內外數字資源存儲系統建設經驗,可借鑒DSpace數字資源存儲系統在數據收集、存儲、索引、保存和發布環節的技術架構、功能模塊、數據標準,研發多源異構數據統一存儲系統,配置各類資源元數據非編程性動態定制、擴展功能。針對不同類型數據資源設定通用型、專屬型元數據字段,進而實現多源異構數據的靈活添加、統一存儲和檢索。
以“軌道交通專業知識服務系統”為例,依托多源異構數據統一存儲系統整合了國內外軌道交通行業各類科技文獻、多媒體資源3億多條。其中,中文期刊1.5萬種,外文期刊1.9萬種,行業內刊56種,國內外鐵路專利55萬條,專業視頻2 000余部,以及豐富的鐵路行業科技獎勵、成果鑒定報告、行業標準、國外鐵路安全簡報等自建資源。
軌道交通專業知識服務模式是軌道交通專業情報服務在大數據技術環境下的發展與創新。依靠人工完成數據檢索、分析的傳統情報服務模式在知識經濟時代稍顯動力不足,大規模批處理數據實施難度大,時間成本高,實際效果不理想。同時,軌道交通行業領域知識的復雜性、交叉性,導致精準化的情報服務對領域知識單元、行業專業術語等的依賴程度更高。因此,適時引入人工智能算法模型,對數據資源進行深度處理和加工成為軌道交通專業知識服務模式落實的必經之路。
以“軌道交通專業知識服務系統”科技文獻知識組織為例,通過引入融合Word2Vec模型的TextRank關鍵詞抽取方法[9],對海量鐵路科技文獻進行內容處理和關鍵詞提取,完成科技文獻的知識內容表征,優化信息檢索精準度,積累并更新鐵路行業基礎詞庫。同時,在前期知識組織成果的基礎上,開展鐵路科技信息資源自動分類標引、領域知識圖譜構建工作。
軌道交通專業知識服務模式的核心特點之一是用戶需求導向,即探索滿足用戶科研、業務決策需求的服務方式和內容。在前期階段,應借助實踐調研、用戶信息,利用行為數據分析等方法深入了解科研機構用戶、科技企業用戶、科研個人用戶的情報服務需求和偏好,以此為依據完成用戶畫像工作,建立多類型用戶知識服務需求模型。參照不同類型用戶知識服務需求模型,提供定制化的知識服務組合,如“專題定制服務+知識工具”“專題定制服務+智能情報”“知識工具+智能情報”等。
“軌道交通專業知識服務系統”設置“專題定制”服務模塊,圍繞用戶的研究方向、目標專題編制高級檢索表達式,并固化在“專題定制”功能模塊內,實現專題信息自動檢索、整合,并借助系統用戶中心、郵箱傳遞等方式提供專題持續推送服務。同時,研發“鐵路大數據詞庫”“軌道交通專業聯想詞檢索系統”等知識工具,幫助科研人員及時更新行業術語,提升情報檢索的專業化程度,為領域知識管理、知識發現提供輔助工具。
軌道交通專業知識服務模式作為一個開放系統,不斷與外界進行“數據—服務”的輸入與輸出活動。該模式的實現和可持續發展需要反饋與優化機制作為保障,以推進系統的功能優化與迭代。建立知識服務反饋與優化機制主要分兩步走:第一,開辟多維度的知識服務反饋渠道,借助系統平臺、微信公眾號、人工熱線等實現高效、及時的用戶知識服務反饋。全面收取用戶知識服務需求及問題咨詢數據,定期進行整合與分析,針對普遍性、典型性的反饋問題進行研討、解決。第二,搭建“用—學—研”三位一體的知識服務優化工作模式,將知識服務過程中用戶反饋點與知識服務理論研究、技術研發相結合,反向指導知識服務優化工作,持續推動服務內容、服務方式、技術支持、系統功能等方面的更新。
“軌道交通專業知識服務系統”在知識服務功能優化方面,始終堅持以用戶反饋為參考,通過現有檢索功能升級、分類瀏覽功能改造,提升知識服務的用戶滿意度。貼合軌道交通領域知識分布廣泛、專業性強等特點,結合用戶檢索過程中遇到的各類疑難,研制出鐵路大數據詞庫、軌道交通專業聯想詞檢索系統等一系列知識工具。同時,通過開展數據采集、數據可視化技術研究工作,探索智能情報服務流程,不斷提升系統的大規模知識生產與輸出能力。
隨著鐵路數字化轉型步伐的加快,鐵路大數據存儲、分析和共享的需求日益增加[10],這也為軌道交通專業知識服務的發展指明方向。以“數據驅動”思維創新科技信息資源的存儲與組織方式,運用大數據算法技術開展資源內容挖掘和數據產品定制服務,建立高效及時的服務反饋優化機制,最終以系統平臺的方式滿足科研用戶的知識需求,支撐我國軌道交通行業科技創新工作的開展。