郝冀斌,郝利劍,梁 巍
(中國北方發動機研究所,大同 037036)
面向產品數字化研發的知識資源集成檢索研究
郝冀斌,郝利劍,梁 巍
(中國北方發動機研究所,大同 037036)
近年來,數字化設計技術已在制造企業中廣泛應用,產品研發的數字化水平已成為衡量企業核心競爭力的重要因素。隨著經濟形勢復雜多變,以及企業間競爭的日趨激烈,傳統的產品設計方法已經很難滿足企業當前生存和發展的需要。為了能在競爭中處于有利位置,實現產品設計數字化勢在必行。
產品數字化研發實施旨在應用信息技術手段,構建數字化設計平臺,改變原有落后的設計方式,通過設計仿真過程管理,搭建協同設計環境,提供工程設計方法導航,推送設計知識資源,進一步推動核心技術突破,從而提升技術創新能力。
知識管理作為數字化研發協同創新過程中的重要一環,是開展產品數字化研發的重要支撐,其中知識資源的有效管理、異構數據集成、精/準確檢索、合理推送等具體應用,為企業資源挖掘、資源整合、數據關聯等業務環節提供了很好的技術平臺。
中國北方發動機研究所是兵器工業高功率柴油機研發設計單位,開展信息化建設多年,具有完備的軟、硬件設計環境,已實施多項信息化管理系統,并在數字化研發、現代設計方法、設計集成環境搭建、知識工程等方面不斷深入研究,在信息化應用方面取得了顯著成果。
隨著企業數字化、信息化工作的不斷深入開展,在企業產品的設計、研制和銷售過程中積累了大量的只是數據。然而長期以來由于“重硬件輕軟件、重系統輕應用”等傾向,導致企業信息系統中的知識資源利用不佳,企業員工知識管理和知識挖掘不足等狀況的產生。在應對新的發展機遇與挑戰的同時,逐步顯現出企業在知識管理方面存在的各種問題與困難。
從上圖所羅列出的企業知識管理存在的問題不難看出,普遍存在企業知識分散、缺乏有效的組織和管理、企業內部各系統積累了大量的知識無法共享應用、缺乏有效的信息資源采集管理工具、企業知識庫建立緩慢及內容匱乏、員工獲取知識途徑單一并檢索困難等方面的問題。面對以上問題與現狀,結合企業數字化研發體系建設需求,為實現企業顯性知識資源和隱形知識的共享與推送,針對研發知識資源采集、異構數據管理、資源檢索與推送等關鍵技術開展了具體技術研究,并進行了一些模式探索。
面對企業知識管理存在的問題,針對企業顯性知識資源,結合企業自身特點,有目標的開展知識資源采集、異構數據管理、資源檢索與推送等關鍵技術研究,主要研究內容如下。

圖1 企業知識管理存在的問題
知識資源從廣義上分為元數據與關系型數據,元數據包括企業(行業)內部的公共資源,具體包括:企業內部分散存儲的紙質、電子數據;互聯網存在的設計知識資源;企業內部無法有效共享的情報、標準、文獻、期刊等信息資源等。關系型數據包括企業內部信息系中管理的處于孤立狀態的產品設計數據。
元數據的采集可通過采用物理文件導入、OCR識別、互聯網數據抓取等手段,將離散、非結構化、不可編輯的數據,抽取進數據倉庫,從而可對這些數據進行整合發布。關系型數據的采集通過異構數據集成方式處理。
采用數據抓取+數據倉庫存儲模式,通過大量的數據分析,利用已有的產品信息分類編碼,建立各類信息系統中異構數據間的關聯關系,在數據倉庫中建立關聯數據庫,針對不同信息系統中的數據應用建立映射數據表,實時抽取信息系統中的數據信息,通過一系列的集成整合技術手段,將各個不同的系統(現有系統及在建系統)的前端訪問、數據展現以及信息發布進行有效的數據管理。同時提供現有應用系統中的數據備份。對未來開發數據挖掘應用做好數據源的準備。
在數據集成管理基礎上,針對各種知識資源的應用特點,應用全文檢索技術開發檢索系統,使之具備跨不同數據庫系統的能力,具備解析異構數據庫的能力,同時也要具備基本的快速、模糊查詢、精確定位的技術和能力。主要功能應包含:數據檢索詞庫管理;提供多樣化的檢索方式,提供用戶按需自定義查詢條件檢索數據;具備與其他管理系統集成的嵌入式查詢功能,即用戶可從其他系統智能檢索所需信息;查詢結果管理功能。具備跨庫級別的統計、分析、對比等處理的功能,并且能夠以多種方式生成查詢結果報告;實時統計數據查詢率、點擊率,具有資源推薦功能;具備數據查詢結果的內容整合功能,能夠導出并形成包含文字、表格、圖片、動畫、狀態信息(時間、版本、技術狀態、提取信息源等)等數據的知識性報告,以便能夠為知識庫提供內容。
從圖2中的總體技術框架中可以看出,知識資源集成檢索平臺以知識積累、存儲、共享、應用、創新的基本過程提供相關的知識管理系統、工具和服務。企業的主要模塊和功能包括:知識信息門戶、智能檢索、知識積累、知識交流、知識導入工具、企業信息化系統數據集成、互聯網信息采集工具、知識加工處理、知識應用服務接口、和系統管理等。整個體系主要針對各種資源信息進行采集整合,在采集整合過程中,要根據該數據資源對應的服務內容,調整數據的存儲內容和格式,使之能符合搜索服務的需求。此外,需要采用相應的采集策略,實現信息的及時、準確獲取,對于應用系統經常新增數據的情況,要實現增量更新采集。

圖2 知識資源集成檢索總體功能框架
知識資源集成檢索包括知識資源管理與展示、通用數據庫管理、互聯網信息采集與管理、信息綜合查詢等四個主要功能模塊。
知識資源管理與展示可針對每一組用戶或者每個用戶,展示不同的系統資源。用戶或者用戶組可以定制不同的資源,從而使系統能夠展示給用戶更有價值的數據,減少用戶查詢特定數據所浪費的時間。個性化資源展示還可以展示由用戶推送過來的或者由系統采集過來的互聯網數據。
通用數據庫管理針對元數據、關系型數據進行管理,元數據管理是使用內容管理軟件的元數據選件,根據不同的數據類型創建不同的元數據類型,并且為每個類型創建一個欄目,將數據保存到對應的欄目當中。關系型數據的管理是通過采集+管理進行的。數據網關負責抽取數據,數據倉庫負責接收并存儲數據。數據的展示是通過開發接口結合二次開發,在基于資源展示平臺上將數據進行展示。通用數據庫通過數據集成接口從現有的應用系統中轉換、抽取、加載數據,通過一系列的集成整合技術手段,將各個不同的系統(現有系統及在建系統)的前端訪問、數據展現以及信息發布進行有效的數據管理。同時提供現有應用系統中的數據備份。對未來開發數據挖掘應用做好數據源的準備。
互聯網信息采集與管理針對研發設計人員關注的互聯網數據,通過設置相應的檢索條件,在指定的網站、論壇、博客等互聯網資源中精確抓取所需要的知識、情報,并通過內容分發在資源展示平臺上進行數據展示?;ヂ摼W檢索支持多語言檢索,支持檢索內容的自動分類,檢索結果可以自動歸類到不同的分類中。

圖3 系統功能框架
信息綜合查詢可提供普通檢索、高級檢索、分類檢索、關聯檢索等檢索方式,可根據個人檢索記錄,整理出整個系統的檢索記錄資料,并根據檢索詞的檢索頻率對檢索詞進行統計。可進行檢索結果收藏與推薦,個性化資源定制推送等互動。
知識資源集成檢索采用B/S及C/S結合的系統架構。前臺數據展示、數據檢索等功能采取B/S結構和Web 服務技術,后臺管理系統采用C/S結構,通過開發系統內部及外部數據接口,實現數據的采集管理與傳遞。主要功能頁面如圖5~圖8所示。

圖5 綜合數據檢索

圖6 數據查詢結果

圖7 知識資源展示
本文對產品數字化設計研發體系中的知識資源集成檢索應用技術進行了深入研究,結合企業自身需求,分析了各類知識資源管理及集成過程,包括知識數據在管理檢索過程中的傳遞過程。通過集成檢索系統的初步實現,大量的知識資源得以有效管理與共享,應用全文檢索技術使知識資源的查詢檢索精準快捷。

圖8 互聯網資源檢索結果管理
[1]張曉星,唐朝暉.企業多源異構數據庫數據集成的研究[J].可編程控制器與工廠自動化,2007,03,66.
[2]Jiawei Han,Michiline Kamber,著.范明,盂小峰,等譯.數據挖掘概念與技術[M].北京:高等教育出版社,2001.
[3]楊平,等.數字化設計制造技術概論[M].北京:國防工業出版社,2005.
[4]趙東,王丁柱,孔惠敏,等.數字化造船系統中的關鍵技術介紹[J].船海工程,2006,20(3):110-112.
[5]王新玉.數字化設計[M].北京:機械工業出版社,2003.
[6]張維鵬,任云鵬,盧崇紹.基于理論的產品創新設計[J].重型機械科技,2006(1):4-8.
[7]李賀,季桂琳.企業知識管理系統構建研究[J].情報科學,2005,23(1):114-1 17.
[8]潘立武,王保保,李緒成.企業知識管理及其知識倉庫的解決方案[J].計算機工程與設計,2002,(11):18-20.
Research on the integration and searches of the knowledge resource for digital product development
HAO Ji-bin, HAO Li-jian, LIANG Wei
本文針對科研院所、制造企業中基于知識管理的數字化設計研發問題,結合企業知識工程的實施應用情況,簡要分析了各類知識資源管理及集成過程,通過對各類知識數據的分析與解構,提出了創新研發體系下知識資源集成檢索與知識推送的框架模型,及具體實現方案,并提出了個人的理解和建議。
數字化研發;知識管理;數據檢索;數據倉庫
郝冀斌(1980 -),男,助理研究員,主要從事企業信息化和數據庫應用開發。
TP274
B
1009-0134(2011)4(上)-0061-05
10.3969/j.issn.1009-0134.2011.4(上).20
2010-10-09