崔靖華 朱學芳
產(chǎn)品創(chuàng)新是企業(yè)發(fā)展的動力,能否開發(fā)出符合市場需求的新產(chǎn)品,是一個企業(yè)發(fā)展的根本。企業(yè)科研人員在進行產(chǎn)品創(chuàng)新時需要用到科技論文,科技論文是國家科技競爭力的重要體現(xiàn),因此有效使用科技論文對于進行產(chǎn)品創(chuàng)新的企業(yè)科研人員來說十分重要。然而,目前由于科技論文語義知識紛繁復雜,企業(yè)科研創(chuàng)新人員在獲取相關知識要點、技術創(chuàng)新知識及研究發(fā)展前沿熱點方面需要手動檢索、搜集、閱讀,其過程繁瑣,耗費了許多時間和精力。若是能夠針對企業(yè)科研人員的創(chuàng)新方向,對相關科技論文進行語義知識組織,并形成語義知識庫,使企業(yè)科研人員可直接查閱知識庫中的相關產(chǎn)品知識,則能有效提高對科技論文知識的利用率,進而提高產(chǎn)品創(chuàng)新效率,為企業(yè)創(chuàng)新發(fā)展做出貢獻。
為了方便企業(yè)科研人員更加快速、全面地獲取關于創(chuàng)新產(chǎn)品的相關科技論文中的相關知識,本研究以智能機器人產(chǎn)品為例,選取該產(chǎn)品國內(nèi)核心科技論文,構建了面向企業(yè)產(chǎn)品創(chuàng)新的科技論文語義知識本體,對其進行可視化,并利用情景分析法探討企業(yè)科研人員如何利用可視化結果進行產(chǎn)品創(chuàng)新,希望能夠提高企業(yè)科研人員對科技論文語義知識的利用率,進一步提升企業(yè)的產(chǎn)品創(chuàng)新效率。
目前,國內(nèi)外關于科技論文研究的側重點在于對科技論文的用詞、詞頻、語義特征等方面進行分析,以構建完善的檢索體系,為科研人員提供科技論文檢索、個性化推薦等服務。馬慧芳等[1]考慮到研究人員難以定位到感興趣的科技論文,就此提出了一種融合作者與文獻影響力的科技論文推薦方法;路永和等[2]基于段落層級結構,分別在詞級和句級使用雙向GRU對寫作需求和參考文獻進行語義建模;王宇[3]完成了面向科技文本的預處理,主要包括短文本化、去除文本噪聲、分詞、去停用詞等,為后續(xù)的科技文本分類工作提供數(shù)據(jù)質(zhì)量的保證和文本數(shù)據(jù)的形式化支持;宋東桓等[4]采用文本挖掘方法對選取的英文科技論文中的單詞、動詞、三詞詞塊、四詞詞塊等進行詞頻、TFIDF值等多個指標的定量統(tǒng)計分析,構建能夠進行結構要素識別的語義特征詞典。國外有Boger等[5]學者在Cite ULike數(shù)據(jù)集上通過實驗表明基于用戶的協(xié)同過濾算法能取得更好的效果;Y.K.Meena等[6]利用科技論文句子特征構建了不同類型的要素識別模型;Chen等[7]使用CNN來提取科技論文文本特征,并使用RNN來產(chǎn)生標簽序列;另外還有國際上一些非常成熟的常用詞表等[8-10]。但目前尚沒有關于企業(yè)產(chǎn)品創(chuàng)新的科技論文語義知識本體構建研究。若能有效地整合企業(yè)科研人員進行產(chǎn)品創(chuàng)新時所需的科技論文語義知識資源,那么對科研人員自身創(chuàng)新水平的提高、對企業(yè)創(chuàng)新競爭能力的提升將產(chǎn)生巨大影響。
產(chǎn)品在設計過程中的知識可分為需求、功能、作用原理、結構等具體方面。需求反映了產(chǎn)品在市場中的一種現(xiàn)有狀況;功能來源于用戶的主觀意愿,體現(xiàn)設計任務和要求,是產(chǎn)品最終的目的;作用原理則是對功能、結構中沖突現(xiàn)象的解決進行詳細說明;結構描述產(chǎn)品的結構組件、結構組件的屬性,以及它們之間的連接[11]。為了描述科研人員在具體設計產(chǎn)品過程中所表現(xiàn)出的這種空間知識結構,悉尼大學Gero[11]提出了關于產(chǎn)品設計的“功能—行為—結構”FBS模型,在后來學者的不斷完善下,最終形成FBS模型“需求—功能—作用原理—結構”關系[11]。本研究為能很好地使科研人員進行產(chǎn)品創(chuàng)新時檢索到所需的科技論文知識,根據(jù)FBS模型中的相對應模塊含義來映射科技論文的語義知識結構,以求在檢索中形成科技知識關聯(lián)本體。
本文以“智能機器人”為主題的國內(nèi)核心科技論文為例,對其題目和摘要進行分詞,再根據(jù)人工校對分詞后的結果進行研究主題提取,共總結出“智能機器人”產(chǎn)品領域的主要研究內(nèi)容,包括設計研究(與FBS模型中的結構知識趨同)、技術研究、應用研究、綜述與趨勢研究、法律問題研究。同時,根據(jù)FBS模型的相對應模塊來映射“智能機器人”產(chǎn)品領域科技論文的語義知識結構,如圖1所示。

圖1 科技論文語義知識結構
本文從企業(yè)科研人員需要創(chuàng)新的產(chǎn)品的核心概念出發(fā),根據(jù)科技論文語義知識結構,確定產(chǎn)品的“類別”“需求”“功能”“作用原理”“結構”“技術”“應用”“綜述”“法律”共9個頂層概念。定義這9個頂層概念及其等級體系,形成科技論文語義知識本體[12]的類別及其等級體系,如表1所示。

表1 科技論文語義知識本體的類別及其等級體系
根據(jù)上述科技論文語義知識本體的類別及其等級體系,企業(yè)科研人員就可在一個產(chǎn)品的開發(fā)設計上系統(tǒng)地了解創(chuàng)新產(chǎn)品的核心知識,并對產(chǎn)品的結構、技術、應用、進展、法律等相關知識有一個全面而深刻的認識。通過產(chǎn)品需求,可及時了解學術需求,并考慮是否可以轉化為市場需求,以進行新產(chǎn)品研發(fā)。企業(yè)科研人員還可以進一步地根據(jù)產(chǎn)品功能了解作者要實現(xiàn)的功能意圖,可以通過產(chǎn)品的作用原理加深對實現(xiàn)產(chǎn)品功能所應用的相關知識的了解。繼而企業(yè)科研人員可以依次分別了解關于產(chǎn)品的結構、技術、應用、進展、法律等方面知識。具體來說有:(1)可根據(jù)產(chǎn)品結構知識了解產(chǎn)品是如何制備的,智能機器人是由哪些機械零件、硬件、軟件等構造而成;(2)可根據(jù)產(chǎn)品技術知識,了解目前智能機器人關鍵技術的研究情況,從而可以在目前研究不足的地方進行創(chuàng)新;(3)可根據(jù)科技論文作者對產(chǎn)品應用領域、應用效果的研究,看是否能夠對該領域的產(chǎn)品結構、技術等進行優(yōu)化,以達到創(chuàng)新;(4)可通過產(chǎn)品綜述與趨勢知識了解智能機器人的現(xiàn)有研究情況,以及未來可能的發(fā)展方向、待解決的問題、改進建議,以進一步推動創(chuàng)新發(fā)展;(5)可通過產(chǎn)品法律知識了解目前智能機器人所存在的一些法律問題,進而避開雷區(qū)。
科技論文語義知識較現(xiàn)有的市場產(chǎn)品技術具有一定的超前性,這將激發(fā)企業(yè)科研人員產(chǎn)生更多的創(chuàng)新想法。根據(jù)上述分析,形成語義類型之間的語義關系集,具體如表2所示。

表2 科技論文語義知識本體語義關系集
本文選取以“智能機器人”產(chǎn)品為主題的國內(nèi)核心科技論文,根據(jù)中國知網(wǎng)上的核心期刊、博碩士論文、會議文獻等數(shù)據(jù)進行檢索,并將檢索到的論文進行前文的相關處理,構建科技論文語義知識類別及類別之間的語義關系,而后利用本體構建工具Protégé[13],分別在Protégé的OWL Classes和Object Properties中編輯科技論文語義知識類別及其語義關系,并根據(jù)編輯好的類別及其等級體系、屬性及其關系,利用Onto Graf形成可視化本體圖,如圖2所示。

圖2 “智能機器人”產(chǎn)品的國內(nèi)核心科技論文可視化本體圖
當企業(yè)科研人員想要進行有關圖書館智能機器人方面的創(chuàng)新設計時,可根據(jù)圖2所示進行創(chuàng)新活動。具體的創(chuàng)新流程可用情景演繹法來進行演繹[14]。以企業(yè)科研人員想要改善圖書館智能機器人的產(chǎn)品結構作為情景演繹的創(chuàng)新目的,具體演繹流程如下。
(1)明確本產(chǎn)品是應用于圖書館體驗區(qū)的智能機器人。
(2)通過可視化本體圖了解目前人工智能在各個領域的滲透情況,知道目前機器人已開始具有自主學習的智能交互能力,并且智能機器人在圖書館已經(jīng)有所應用,如沈陽市圖書館智能機器人“伴讀”、上海圖書館前臺咨詢機器人“圖小靈”。
(3)研究智能機器人在圖書館體驗區(qū)的應用功能,主要包括書籍檢索、導航指引、讀者信息查詢、智能迎賓及問答,以此為智能機器人在圖書館中的應用研究提供參考。
(4)了解智能機器人所用到的作用原理,包括圖像處理原理、傳感器原理、信號采集原理、語音識別原理、機器視覺原理及其他原理。
(5)關于應用于圖書館體驗區(qū)的智能機器人的結構設計方面,要清楚了解智能機器人的系統(tǒng)電控設計,包括本地化的智能云平臺、機器人客戶端等;在硬件的具體設計上要清楚了解傳感器、核心控制板等;在軟件設計上要知道包含感知處理模塊、系統(tǒng)報表模塊、外部查詢模塊等。
在上述逐步引導下,可幫助企業(yè)科研人員更快、更高效地了解圖書館智能機器人的相關知識,有助于企業(yè)科研人員全面系統(tǒng)的掌握相關知識,進而啟發(fā)企業(yè)科研人員的創(chuàng)新想法。其相關設計研究的具體創(chuàng)新流程路徑如圖3所示。

圖3 圖書館智能機器人的設計研究
為了給構建企業(yè)產(chǎn)品科技論文語義知識庫做鋪墊,本文以當前的熱點項目——智能機器人為例,構建了面向企業(yè)產(chǎn)品創(chuàng)新的科技論文語義知識本體。通過實例,我們知道一篇產(chǎn)品科技論文中大多有描述需求知識的研究背景、研究現(xiàn)狀,描述功能知識的研究目的、意義、結論,描述原理知識的一些相關原理,描述結構知識的產(chǎn)品的具體設計。為此,需要根據(jù)不同領域產(chǎn)品的科技論文的主要研究內(nèi)容來構建語義模型,形成該領域產(chǎn)品的科技論文語義知識本體。進一步來講,我們將在后續(xù)研究中與相關企業(yè)合作,讓企業(yè)科研人員在具體開發(fā)新產(chǎn)品的過程中,通過利用相關產(chǎn)品科技論文語義知識本體,構建起關系型知識數(shù)據(jù)庫,并基于關系型數(shù)據(jù)庫的查詢,結合Web檢索、本體推理等技術構建企業(yè)產(chǎn)品科技論文語義知識庫,為企業(yè)科研人員提供知識資源,并在企業(yè)科研人員的不斷反饋下修正該知識庫。