陳 亮,陳博文,劉曉敏,竇 昊
(福州大學機械工程及自動化學院,福建 福州 350108)
仿生是一種將自然界的生物信息應用于工程和技術領域的方法,在產品創新設計方面具有廣闊的應用前景。目前,針對仿生創新設計的研究主要集中在生物信息獲取和知識模型建立、生物知識向工程設計轉化、協同創新設計以及仿生創新設計工具的開發等方面。
在生物信息獲取和知識模型建立方面:Shu等人[1]結合自然語言知識,將生物信息轉化為語言概率問題進行求解;Cheong等人[2]開發了一種基于功能基的工程—生物文本映射方法,以進行知識映射;袁雪青等人[3]從生物形態的角度出發,采用灰色關聯聚類分析構建了基于用戶期望的意象驅動生物模型庫;陳航等人[4]從構建面向微生物領域的知識庫出發,通過構建知識詞典的方式來構建生物知識檢索系統。
在生物知識向工程設計轉化方面:任露泉等人[5]提出了生物耦合概念,基于對特定生物原型的觀察,分析了生物耦合生成的機理和規律,并將其應用于產品設計;Sartori等人[6]運用SAPPhIRE模型完成了多個生物模型向技術系統的轉化;劉偉等人[7]結合類比原理和TRIZ(Teoriya Resheniya Izobreatatelskikh Za-datch,發明問題解決理論),提出了基于TRIZ的類比源設計求解過程模型;黃水平等人[8]基于對產品功能原理設計和生物基因進化方面類比結果的相似性分析,引入產品功能特征基因概念,構建了一種基于TRIZ與基因進化理論的產品集成創新設計過程模型。
在協同創新設計方面:楊育等人[9]提出了運用二元語義分析來集結各主體多粒度評價語言信息的方法,并以滿意度最大為優化目標建立了多主體沖突協調模型;邢永剛等人[10]針對耦合系統的優化問題,將協同進化算法中的分解、協作思想與多學科設計優化方法中的分解、協同思想結合,提出了一種協同進化多學科設計優化算法,以提高耦合系統的適應性;Goel等人[11]針對生物啟發設計開發了基于知識的CAD(computer aided design,計算機輔助設計)系統,通過提供生物系統的功能模型,將搜索到的結果以多種形式呈現給用戶。
在仿生創新工具方面:Chakrabarti等人[12]研發了基于因果關系模型的IDEA-INSPPhIRE軟件,通過因果關系描述語言來獲取不同層次關系上的產品設計生物策略;Vandevenne等人[13]構建了生物數據庫,可供設計人員查找設計相關的生物知識,以產生創新想法;Vincent等人[14]基于TRIZ開發了一款包含生物效應的BioTRIZ軟件,方便設計人員查找仿生創新設計問題相關的生物解;Kozaki等人[15]基于產品與生物特征關鍵詞開發了Biomimetics Hozo軟件,可通過詞義挖掘檢索相應的生物知識;Kim等人[16]構建的Bionic MIR是一個通過結構化的產品特征檢索并抓取在線生物信息的系統,利用潛在語義匹配方式產生對應的生物文本。
綜上,盡管目前許多方法均可以完成產品與生物原型之間的映射,但是由于這些方法過多依靠人為介入進行知識檢索,使得在有海量生物知識數據的情況下檢索效率低下,在生物知識較少的情況下設計人員易陷入思維局限,難以生成較好的方案。考慮到基于用戶需求進行仿生產品創新設計可以有效提高設計的可靠性,減少設計的不確定性和降低設計成本[17],但基于用戶需求的分析具有模糊性,且生成的方案依賴于大量已有知識儲備[18],筆者擬提出一種結合網絡生物文本的創新設計方法,該方法包含基于QFD(quality function deployment,質量功能展開)理論的多學科需求映射(multi-disciplinary requirement map-ping,MDRM)、基于神經網絡的生物知識表示方法以及基于詞空間相似度和圖相似度的產品設計關鍵詞到生物文本的模糊映射方法,同時結合了海量生物文本數據和基于用戶需求進行產品設計的優點。
為實現工程產品與生物文本信息之間的相互映射,需分別采用規范的方法來表述工程產品和生物文本的相關信息。本文將利用MDRM方法對基于用戶需求的工程產品的功能、原理、行為和結構等要素進行表述,同時對從網絡環境中獲取的自然語言文本進行規范化存儲。
基于QFD理論中的質量屋工具構建MDRM方法:先對工程產品的設計要素及生物文本信息進行規范化表達,再將用戶需求轉化為功能、原理、行為、結構四個方面的設計指標,結合質量屋工具,生成一系列產品設計關鍵詞。MDRM方法的應用流程如圖1所示,具體為:首先,通過分析用戶需求來提煉關鍵信息,按照用戶需求分配各項需求的權重并確定相應的指標;然后,從功能、原理、行為、結構四個方面對各項指標進行分類并分別構建質量屋;最后,設置評分閾值以篩除分數過低的指標,得到最終用于檢索的關鍵詞集合。

圖1 多學科需求映射方法應用流程Fig.1 Application flow of MDRM method
在MDRM方法中,基于用戶需求分配的各指標的權重為:

式中:Su為功能、原理、行為、結構指標的評分向量;RT為用戶需求向量的轉置向量;Cu為功能、原理、行為、結構指標的權重系數。
用于檢索的關鍵詞集合W為:

式中:wk為關鍵詞;cwk為關鍵詞wk對應的檢索分數;t為用于篩除分數過低指標的評分閾值。
利用互聯網獲取大量生物文本,通過文本清洗剔除文本中無意義的語句和單詞,并用神經網絡模型以及合適的語料訓練文本詞性標注模型,并對每個單詞進行詞性標注,以“主語+謂語”的二元組方式表示語句信息,最后將二元組表示的生物文本信息導入MySQL數據庫中。
網絡生物文本規范化表示與信息提取的整體流程如圖2所示。首先,分析各大生物站點頁面代碼并提取有效文本信息,對文本進行單詞詞干提取,并對其中出現頻數過低的單詞進行統一編碼,得到一系列規范表示的生物文本信息;然后,使用Conll2000語料以及由Embedding+BiLSTM+CRF層組成的神經網絡模型進行文本詞性標注訓練,預測規范表示的生物文本信息,并對文本語句中的主語關鍵詞以及謂語關鍵詞進行標注,由此得到一系列二元組文本。二元組文本中的主語關鍵詞和謂語關鍵詞用頂點表示,邏輯關聯用相連邊表示,以圖的形式存儲。

圖2 網絡生物文本的規范化表示與信息提取Fig.2 Normalized expression and information extraction of internet biological texts
針對利用MDRM方法得到的一系列產品設計關鍵詞和爬取得到的海量網絡生物文本信息及相應的二元組文本信息,需通過一種映射模式來構建兩者的關系。基于此,提出一種基于詞空間相似度和圖相似度的由產品設計關鍵詞到網絡生物文本的模糊映射模式,以及由生物二元組文本映射到產品設計方案的方法。
對于一批給定的語料,其含有n個不同的單詞。將n個不同的單詞映射為從1到n的索引編碼,則語料中位置i處的單詞用向量可以表示為di=[di1di2…dij…din]T,假設位于語料中位置i處的單詞wi對應的索引編碼為j,則dij=1,其余位置處為0。以用上述方式表示的詞向量作為Word2Vec模型的輸入和輸出,并根據神經網絡模型中的隱層分配低維向量的權重,得到詞嵌入向量。基于Word2Vec模型,工程產品與生物原型相關的一系列文本詞被嵌入到同一個空間域中,通過計算詞向量間的空間余弦距離來判斷不同文本詞之間的相似度:若相似度為1,則表示2個單詞完全相同;若相似度為-1,則表示2個單詞完全不同。
對于某一原始關鍵詞,通過設定相似度閾值可將其擴展成一系列語義相近的詞。當用戶進行某關鍵詞檢索時,在MySQL數據庫的二元組文本圖中尋找由式(2)得到的所有匹配頂點,得到與原始關鍵詞相連的頂點,并選出與原始關鍵詞有共同相鄰頂點的語義相近詞,將其作為有效檢索關鍵詞。設主語關鍵詞用Ks表示,謂語關鍵詞用Ko表示。如圖3所示,設某一原始主語關鍵詞為Ks1,通過計算空間余弦距離得到數據庫中其他詞與該關鍵詞的相似度,并通過設置相似度閾值v來得到一系列語義相近詞Ks1、Ks2、Ks3和Ks4,通過檢索二元組文本圖,得到與原始主語關鍵詞Ks1有共同相鄰頂點的語義相近詞為Ko1和Ko2,則有效關鍵詞為Ks1、Ks2和Ks4。通過TF-IDF(term fre-quency-inverse document frequency,詞頻-逆向文檔頻率)編碼對各有效關鍵詞在每篇文本中出現的次數進行評分統計,分數最高的生物文本即為該關鍵詞的映射目標。

圖3 二元組文本圖匹配示例Fig.3 Matching example of two-tuple text graph
生物文本按照映射得分從高到低依次排列,優先從得分最高的生物文本對應的一系列二元組文本中尋找包含檢索關鍵詞的二元組對。若所匹配的關鍵詞為主語關鍵詞,則二元組文本中的謂語關鍵詞為工程產品根據該檢索關鍵詞映射得到的生物原型的策略;若所匹配的關鍵詞為謂語關鍵詞,則二元組文本中的主語關鍵詞為工程產品根據該檢索關鍵詞映射得到的生物原型的動作。若最終得到的產品不滿足用戶需求,則選擇得分第二高的生物文本進行同樣操作,以此類推。從生物文本到工程產品的映射流程如圖4所示,由檢索結果得到工程產品設計方案后,根據當前產品設計方案是否滿足設計需求來決定是否重新進行檢索。
基于上文提出的用戶需求映射網絡生物文本的創新設計方法,開發相應的應用程序,并以管式空氣加熱器創新設計為例驗證該方法的可行性。
管式空氣加熱器利用不銹鋼電加熱管對內腔氣體進行加熱,該加熱器具有結構簡單、不受生產工藝流程限制的優點。然而,現有管式空氣加熱器的余熱利用率不理想且熱效率低,因此有必要對其結構進行優化。圖5所示為現有管式空氣加熱器的結構。從用戶角度來看,對管式空氣加熱器的需求為提高余熱利用率、增加發熱量及增強環保性。對各項需求進行權重分配,得到需求向量R=[0.4 0.4 0.2]T。
如圖6所示,根據各項需求的權重,分別從功能、原理、行為和結構四個方面確定與需求相關的指標。鑒于數據庫中的生物文本信息為英文語句,為正確匹配關鍵詞,在應用程序中輸入的指標需用英文表示。對于管式空氣加熱器,通過分析得到其功能指標為加熱(heating),原理指標為電導率(conductivity)、熱(thermal),行為指標為傳播(spread),結構指標為電熱管(pipe)、腔殼(cover)。根據經驗分配各項指標的權重系數,可得:


圖4 從生物文本到工程產品的映射流程Fig.4 Mapping flow from biological text to engineering product

圖5 管式空氣加熱器結構示意圖Fig.5 Structure diagram of tubular type air heater

根據式(1)計算得到各項指標的評分向量:

由所得結果可知,加熱(heating)、電導率(con-ductivity)、熱(thermal)所對應的指標的權重得分遠高于其他指標,則選定評分閾值t=1.6,確定檢索關鍵詞為加熱(heating)、電導率(conductivity)和熱(ther-mal)。

圖6 生物文本檢索程序操作流程Fig.6 Operation process of biological text indexing program
根據MDRM方法得到3個檢索關鍵詞后,通過調整檢索模糊度來設定相似關鍵詞的覆蓋范圍。當檢索模糊度設為0時,表明僅在文本中匹配當前選定的3個關鍵詞。本文設定的檢索模糊度為5,點擊搜索,匹配得到一系列可用于管式空氣加熱器仿生設計的參照生物以及相應的匹配得分。單擊某一種生物,可查看該生物的文本信息和逐句提取生物文本語句。單擊某一條語句,可以查看語句中的一系列二元組,并列出與檢索關鍵詞匹配的二元組元素、對應相似度以及作為映射策略的二元組中的另一個元素。圖7所示為適用于管式空氣加熱器仿生設計的生物文本檢索結果。由檢索結果可以看出,斑眼冢雉(Mallee-fowl)和美利奴羊(Merino sheep)的檢索得分明顯高于其他匹配項,因此選用斑眼冢雉和美利奴羊作為管式空氣加熱器設計方案生成的參照生物。

圖7 適用于管式空氣加熱器仿生設計的生物文本檢索結果Fig.7 Searching results of biological texts for bionic design of tubular type air heater
對于圖7所示的2篇生物文本,逐句查看語句中二元組的匹配相似度,分別提取2篇生物文本中相似度最高的句子:1)“In autumn,to keep warm,he cov-ers layers in the evening to retain the heat”;2)“Gener-ally a dense coat of underhairs,as in the wool of a sheep,is particularly effective in temperature control,because hundreds of tiny air pockets become trapped among the hairs and keep an insulating layer between animal and climate”。根據二元組對應的映射結果,分別生成在氣體入口和出口添加帶孔隔離板(斑眼冢雉映射方案)以及在上下壁處設置凹坑結構(美利奴羊映射方案)的2種設計方案,如圖8所示。

圖8 管式空氣加熱器仿生設計方案Fig.8 Bionic design schemes of tubular type air heater
令由斑眼冢雉映射得到的在氣體入口和出口添加帶孔隔離板方案為方案1,由美利奴羊映射得到的在上下壁處設置凹坑結構的方案為方案2,結合圖5所示的原方案,對3種管式空氣加熱器進行仿真模擬,觀察其加熱情況。在Fluent軟件中,統一設置Laminar求解模型:入口風速為8.33×10-6m/s,入口溫度為-20℃,入口為velocity,出口為outflow,求解方式為Green-Gauss Cell Based。表1所示為3種管式空氣加熱器在不同放熱量下的加熱效果對比。由表1可以看出,相比于原管式空氣加熱器,方案1對應的管式空氣加熱器的加熱性能明顯提升;方案2對應的管式空氣加熱器的加熱性能略有減弱。因此選用方案1作為最終設計方案。
本文提出的用戶需求映射網絡生物文本的創新設計方法可以系統地指導設計人員完成不同產品的仿生設計,由于這種方法是基于網絡環境獲取生物文本信息并采取文本模糊匹配和評分機制,可以同時保證索引文本的數量和質量。二元組的方案映射機制一方面可引導設計人員生成設計方案,另一方面又能發揮設計人員的主觀能動性。基于本文所提方法生成的產品設計方案并不唯一,設計人員可以橫向對比幾種不同設計方案以得出最佳設計方案,從而避免單一設計方案效果不理想的缺陷。從管式空氣加熱器創新設計實例可以看出,本文提出的創新設計方法可使產品設計更具有目標性,同時具有較高的設計效率。后續將進一步研究網絡生物文本知識轉化率的提高方法以及多種語言的適配問題。

表1 不同管式空氣加熱器的加熱效果對比Table 1 Comparison of heating effect of different tu-bular type air heaters