梁恩武 高云峰 劉全全 宋志學 張雙雙 馮釗 鄭天宇
(中海油能源發(fā)展股份有限公司工程技術分公司 天津 300452)
科技情報是決策的關鍵,也是創(chuàng)新的導向。在科學技術迅速發(fā)展的今天,科技情報工作的作用越來越顯著,科技情報研究越來越重要??萍记閳笱芯烤褪轻槍_資料的采集分析,根據決策者的需求,進行信息檢索、信息匯聚、信息分類、信息篩選、信息分析、信息創(chuàng)造等工作,最終給予決策者相應的對策建議,實現科學技術的快速發(fā)展。在大數據、智能化的新形勢下,科技情報研究需要及時變革,適應時代的發(fā)展。
1.1.1 人力驅動型科技情報研究模式階段
(1)情報調研提綱設計?;跊Q策者的需求,確定研究題目、技術領域、技術現狀和預期目標,初步查找資料,以問題為導向設計情報調研提綱。
(2)情報分析提綱確認。確定提綱、日程安排以及其他內容,針對提綱多次與決策者交流確認,一般需求是調研一個特定的技術領域,包括國內外戰(zhàn)略規(guī)劃、技術發(fā)展現狀與趨勢、技術研究與應用情況,以及國家、科研機構、企業(yè)各層面技術競爭力評估,并基于上述詳細調研與分析結果,提出對策建議。
(3)多源異構公開信息全面采集。根據情報分析提綱,研究人員從不同的公開信息源手工檢索多種類型信息,包括論文、專利、標準、圖書、科技報告、統計信息、新聞資訊、高峰論壇、科技成果、技術官網等,例如中國知網、SPE 數據庫、EPS+STM 數據庫、德溫特專利索引數據庫(DI)、智慧芽專利數據庫、沙特阿拉伯阿美石油公司官網、美國能源部官網、石油圈網站等。
(4)原始資料全文下載。通過預篩選與公開信息驗證,得到相匹配的原始資料全文,將相關的大量信息儲存為原始數據資料,保存在分散的個人存儲設備中。
(5)原始數據手工清洗、歸納分類。精譯、精讀原始資料全文之后,進行數據抽取、數據清洗、數據分類、數據規(guī)范化等。由于沒有合適的方法體系和智能化分析工具,需要手工處理從論文、專利、標準等數據庫下載的結構化數據,以及從各種網站下載的科技成果、報告文件、相關視頻等非結構化數據。
(6)關鍵內容確認。二次篩選確定所需的關鍵內容,并進行校對。階段(3)~(6)是多次循環(huán)進行的,隨時發(fā)現新的資料,或者隨時根據與決策者交流后的要求和成果等添加資料,同時初步編寫報告部分章節(jié)的內容,并在課題研究過程中不斷地追蹤,并與決策者交流。
(7)信息手工分析總結。需要使用定量分析、定性分析等方法來整合關鍵數據資料,從而分析總結出規(guī)律、趨勢等創(chuàng)造性的知識。目前,使用的定量方法主要是通過分析科技論文、科技成果及專利的數量等找到及評估技術發(fā)展現狀與趨勢、生產科研的技術水平對比分析等。定性方法主要有德爾菲法、文獻綜述、頭腦風暴、黃金圈法、麥肯錫七步法、SWOT 分析、5W2H 分析、4M1E分析等。
(8)情報成果編制??萍记閳笱芯咳藛T根據分析總結的結果與綜合各種信息得出對策建議、相應發(fā)展路徑,根據決策者的需求生成各種類型的情報產品,主要包括了簡報、匯編、總結報告、展示PPT、期刊論文、評論等。
(9)情報成果評估、修正。根據專家、管理層的反饋結果持續(xù)修正。高質量的情報研究成果被決策者采用并付諸實施,或者作為進一步決策的支撐,而質量不高的情報研究成果基于反饋結果重復上述(1)~(8)階段持續(xù)進行修正,進一步補充內容。
(10)最終成果提交。最終提交報告、圖紙、參考資料包等決策者要求的內容。
1.1.2 人力驅動型科技情報研究模式問題
在大數據、智能化的時代,決策層對多源異構數據資料的全面性獲取與實時分析的需求越來越高。目前,在數據爆炸的狀態(tài)下,信息的體量和類型已經遠遠超出手工歸納分類、綜合分析的能力。而且由于科技情報研究通常有固定的完成期限,一般情況下決策者需要快速做出規(guī)劃方向判斷,要求完成報告的時間很短,需要有比較大的樣本、良好的知識管理能力、合適的綜合分析方法,才能在有限的時間內產出高質量的情報研究成果,從而高效支撐決策層。很顯然,目前的人力驅動型科技情報研究模式存在諸多的問題和局限性,無法適應不斷變化的生產和科研決策環(huán)境的需求,主要存在以下問題。
(1)人員有限。在科研單位中,科技情報研究部門一般人員較少,面對甲方較多的科技情報需求,無法快速、有效地滿足,容易出現科技情報成果質量不高、無法按時完成的情況。
(2)專業(yè)能力不足。在科研單位中,科技情報研究部門一般沒有針對所有研究方向、產業(yè)方向的專業(yè)情報人員,對各個專業(yè)方向的科技情報需求,無法快速地進行理解、分析,影響科技情報成果的質量。
(3)情報研究過程時間過長。每個研究階段需要大量的時間和人力進行工作,尤其是在多源異構公開信息采集、信息手工歸納分類、信息手工分析總結階段。這些階段還嚴重依賴手工采集、解讀、分類、處理大量的信息。
(4)情報發(fā)現分析能力有限。由于在科技情報研究需采集和處理的大部分數據來源廣泛,涉及多種格式的文本信息,且沒有完善的理論分析方法,目前主要依賴手工模式,情報研究人員能夠全面采集、有效分析的數據只占較小的比例。
(5)情報成果管理問題。情報研究產品、數據通常儲存在分散的個人存儲系統當中,沒有合適的網絡平臺來共享和傳播相關成果,因而不能高效地進行管理和利用[1-2]。
針對核心技術資料的獲取,科技情報研究部門,根據決策者的需求,以科技創(chuàng)新為導向,目前未能形成固定研究模式,主要通過以下方法獲取核心技術資料。
1.2.1 深度訪談
向本集團系統內部知情專家不斷地請教、訪談,有效獲得核心科技情報成果,實現對應的技術快速發(fā)展。
1.2.2 加強合作
與優(yōu)秀的科技情報咨詢公司合作,利用咨詢公司的專家?guī)熨Y源,找到對應的知情人員,有效獲得核心科技情報成果。
1.2.3 現場調研針對公司技術弱項,鎖定國內外相關技術領域的領跑者,并與其進行現場交流、調研、學習,獲取技術情報,實現相關技術領域的水平提升。
基于人力驅動型科技情報研究模式面臨的檢索、分析等方面問題,隨著越來越多的決策層需要通過集成和分析海量的多源異構數據來滿足預見性判斷,全球95%的信息都是公開信息,因此發(fā)展基于大數據的智能化分析模式乃至解決方案型分析模式,將是未來科技情報研究的主要發(fā)展方向。
2.1.1 大數據智能化分析科技情報研究模式
對于科技情報研究工作,獲得一切結論的依據來源于數據樣本,參考的樣本越多,所得結論的準確度越高。窮盡樣本模式幾乎很難達到,但是隨著語義分析等的大數據智能化分析技術、超級計算機的出現等讓不可能變成可能。國際市場上已經出現了提供語義分析服務的供應商,可以通過語義分析技術實現模擬人腦的閱讀和分析過程,對海量的文本信息進行自動過濾并提取出高價值情報。
2.1.2 大數據智能化分析科技情報研究模式實現路徑
(1)完善科技情報研究隊伍。完善適應新時期需要的科技情報研究隊伍,按照科研單位技術創(chuàng)新的需要,繼續(xù)挑選、引進專業(yè)對應的情報研究人才,為科研單位研究方向、公司產業(yè)方向提供情報服務。
繼續(xù)提高科技情報研究隊伍的專業(yè)能力,對基層情報研究人員來說,專業(yè)技術能力是絕對要放在第一位的。提高科技情報研究隊伍的專業(yè)能力的方法就是學習,因為情報研究的服務對象、服務內容不斷隨用戶情況、國際國內環(huán)境以及科學技術的發(fā)展而變化。學習相關專業(yè)技術的途徑可以通過自學、專業(yè)培訓以及相關人員的請教,不斷更新知識、提高能力。
(2)建立健全科技情報研究平臺。科技情報研究平臺的建立健全,需要“四模塊”的相互協作,包括數據集成模塊、篩選檢索模塊、統計分析模塊、成果管理模塊,它們是進行情報研究服務的平臺組成部分。統計分析模塊是一個有形、無形相結合的信息分析處理模塊,其功能是提高處理信息的速度和水平,能夠智能化地生成統計分析初步報告,保證信息產品的質量[3-4]。
如圖1所示,平臺系統由數據層、平臺層、應用層、用戶層組成,數據集成模塊、篩選檢索模塊、統計分析模塊、成果管理模塊要求的功能作用在此平臺上可以有效實現。

圖1 平臺架構圖
數據層主要由已購買數據庫資源、免費公開數據庫資源、專業(yè)網站實時爬取數據、實時新聞資訊爬取等組成,可以實現全球多源異構數據資源集成,匯聚數據通過數據清洗、數據聚類、數據標注形成具有領域標簽的可檢索、分析、處理的數據支撐上層應用。
平臺層主要提供各類技術支撐組件,基于聚類檢索技術、可視化技術、訂閱、推送、知識圖譜技術、NLP技術等實現對業(yè)務、數據功能的后臺支撐,通過接口開發(fā)實現數據的快速同步和推送,可以實現中文關鍵詞聚合檢索采集、二次多維檢索篩選關鍵內容。
應用層面向用戶提供針對不同用戶應用環(huán)境的針對性應用,保障數據、技術的應用落地,提供情報智能化分析工具賦能科研人員提供自動化分析、輔助分析等不同的業(yè)務支撐,提供數據推送服務,將數據推送至各類終端、系統,實現數據的復用,拓寬科研情報成果的推廣渠道,增加成果的影響力,其中,文獻可利用CiteSpace等軟件工具進行聚類分析、共引分析等,專利可利用DDA等進行專利地圖、成熟度分析等。
(3)發(fā)揮科技情報價值評估的導向作用。評估科技情報成果的價值不只是為了客觀、公正地肯定情報研究人員的勞動成果,鼓勵其更加努力地去提高情報研究水平,更重要的是讓情報研究部門的收益與其情報研究服務產生的效益直接掛鉤,提高情報研究人員的積極性、責任感,提升“命運與共”的使命感,這將開創(chuàng)出雙贏和諧的局面。情報研究人員給用戶提供滿意的情報研究服務,提高了用戶的技術創(chuàng)新能力,使用戶在科研、生產過程中得到很大的收益;獲益的用戶回報給情報研究人員相應的項目利益,包括產值、獎勵、項目掛名等。
目前未能形成固定的核心情報研究模式,全球4%的信息處于保密狀態(tài),屬于核心情報,在知識經濟時代,核心技術資料是商業(yè)競爭的關鍵因素,圍繞核心技術資料的獲取與保密是一場“沒有硝煙的戰(zhàn)爭”,受到越來越多決策層的高度關注,因此,發(fā)展核心技術資料獲取的途徑,是未來技術跨越式發(fā)展的緊迫需求。
2.2.1 核心技術資料的認定
能稱之為“核心技術資料”的技術信息必須滿足以下兩個條件:一是該技術信息沒有被公眾所普遍知曉,不能從公開渠道輕易獲取,甚至沒有專利保護,技術信息的權利主體認為其需要保密;二是具有實用性,即具有確定的實用價值,能夠付諸實踐,能夠給權利主體帶來現實的、潛在的經濟效益。
2.2.2 核心技術資料的獲取路徑
(1)深度訪談獲取技術資料??上蛟摷瘓F系統內部知情專家不斷地請教、訪談,利用內部單位的良好關系,有效獲得核心科技情報成果,實現對應的技術快速發(fā)展。
(2)加強咨詢公司合作。與優(yōu)秀的科技情報咨詢公司合作,利用咨詢公司的國內外專家?guī)熨Y源,找到對應的知情人員,有效獲得核心科技情報成果。
(3)現場調研獲取情報。針對公司技術弱項,鎖定國內外相關技術領域的領跑者,進行現場交流、調研、學習,獲取技術情報,實現相關技術領域的水平提升。
(4)通過公司員工獲取。對于一些核心技術,如果沒有很明確的合同保密約定,員工在離職后仍可以繼續(xù)使用,企業(yè)只要能夠招聘到這些員工,就能夠掌握到一部分的核心技術資料。
(5)反向工程法。公開渠道購買核心技術產品,通過技術手段進行拆卸、測繪、分析、實驗等,獲得該技術產品的有關技術信息,達到技術進步的目的。
(6)企業(yè)間轉讓、交換核心技術。對于相互有技術需求的企業(yè)之間,可以根據實際情況交換核心技術資料,此舉將為雙方的研發(fā)團隊節(jié)省大量的人力、物力、財力,雙方實現了互通有無,達到雙贏[5-7]。
應用大數據智能化分析科技情報研究模式:一是人員,形成能為技術創(chuàng)新導向的科技情報研究隊伍;二是工具,建立健全科技情報研究平臺,需要數據集成模塊、篩選檢索模塊、統計分析模塊、成果管理模塊的相互協作;三是體制,發(fā)揮科技情報價值評估的導向作用,讓情報研究部門的收益與其情報研究服務產生的效益直接掛鉤,提高情報研究人員的積極性、責任感。
核心情報研究能夠實現未來技術快速發(fā)展、跨越式發(fā)展的需求,核心技術資料的獲取路徑包括:深度訪談獲取技術資料,加強咨詢公司合作,現場調研獲取情報,通過公司員工獲取,反向工程法,企業(yè)間轉讓、交換核心技術。
(1)建立健全大數據智能化分析平臺,擁有全球相關行業(yè)多源異構數據融合、數據實時挖掘、高效智能化可視化分析、數據關聯關系發(fā)現、創(chuàng)造性知識輸出等功能,全面、精準、及時地獲取科技情報。(2)培養(yǎng)能為技術創(chuàng)新導向的科技情報研究專業(yè)隊伍,掌握大數據智能化分析平臺構建操作技能、公開信息,以及及核心情報獲取研究方法、科技情報研究流程等,提供有效的決策支持。(3)發(fā)揮科技情報價值評估的導向作用,創(chuàng)新體制機制,讓情報研究部門的收益與其情報研究服務產生的效益直接掛鉤,提高情報研究人員的積極性、責任感、使命感。