蔣偉 蘭州大學淮安高新技術研究院 董翔/蘭州大學圖書館/敦煌學研究所/蘭州大學淮安高新技術研究院 史志林 敦煌學研究所
甘肅華夏文明傳承創新區建設,按照國家關于甘肅發展的戰略定位和建設文化大省的總要求,以文化建設為主題。包括以敦煌文化為核心的河西走廊文化生態區,以形成集遺產保護、景觀旅游、事業服務、產業發展、產品交易、文化交流為一體的文化展示研究基地和文化園區。本文旨在通過圖像識別的方式用于華夏文明視角下主題知識庫檢索分析,改變只能靠關鍵詞檢索的單一檢索方式,進而豐富信息檢索方法,對于華夏文明的建設發展具有積極的意義。
對于華夏文明知識庫構建流程,本文采用許鑫等提出一個新的基于本體的專題知識庫構建模型,主要分為6個步驟,如下圖所示。

圖1 基于本體的專題知識庫構建流程
圖像識別,是指利用計算機對圖像進行處理、分析和理解,以識別各種不同模式的目標和對像的技術。一般工業使用中,采用工業相機拍攝圖片,然后再利用軟件根據圖片灰階差做進一步識別處理,圖像識別軟件國外代表的有康耐視等,國內代表的有圖智能等。
作為智能領域的重要組成部分,圖像識別的發展先后經歷了文字識別、數字圖像處理與識別、物體識別三個發展階段,而在今天的圖像識別技術中,其本身所具備的功能早已超過了人類的極限,這也是人工智能的圖像識別技術能夠在我國多種領域實現較好應用的原因所在。
圖像識別技術本身的原理并不算太過復雜,信息的處理是這一技術的關鍵點所在,由于應用計算機實現的圖像識別技術本身與人眼識別并不存在著本質的差別,這就使得圖像識別技術同樣需要根據自身對圖像的記憶完成具體的識別工作。在人類進行圖像識別的過程中,人類的大腦會將圖像的特征進行提取,并結合大腦中以往對各類圖像的認知判斷自身是否對圖像存在過印象,這就是人們能夠在觀看一張圖片后快速對其識別的原因所在。結合人類識別圖像的原理,在計算機進行的圖像識別中,計算機首先就能夠完成圖像分類并選出重要信息、排除冗余信息,根據這一分類計算機就能夠結合自身記憶存儲結合相關要求進行圖像的識別,這一過程本身與人腦識別圖像并不存在著本質差別。對于圖像識別技術來說,其本身提取出的圖像特征直接關系著圖像識別能否取得較為滿意的結果。值得注意的是,由于計算機歸根結底不同于人類的大腦,所以計算機提取出的圖像特征存在著不穩定性,這種不穩定性往往會因為計算機提取圖像特征的明顯與普通影響圖像識別的效率與準確性,由此可見圖像特征對于人工智能中圖像識別技術的重要意義。
本文正是借鑒了圖像識別相關技術,用于“華夏文明”視角下主題知識庫的檢索中,進而兼顧效率與準確性。
基于圖像識別的華夏文明視角下主題知識庫檢索方法,既提高了檢索的效率,同時保證了檢索結果的準確性,從而提高“華夏文明”視角下主題知識庫在用戶檢索中的效率和準確性。具體檢索流程主要包括以下步驟,如下圖所示。

圖2 “華夏文明”視角下知識HASH庫建立過程
4.1.1 Hash 庫建立
首先對入庫的“華夏文明”視角下主題知識進行特征點提取,將特征點依次相連形成線段;計算線段拐角的角度值,并進行篩選,與對應“華夏文明”主題知識一一綁定,存入數據庫中,建立“華夏文明”主題知識Hash庫;
4.1.2 “華夏文明”視角下知識庫檢索過程
首先對用戶的檢索條件進行分析,進行特征點提取,將特征點依次相連,計算線段拐角的角度值,并進行篩選,根據提取的角度值,在“華夏文明”主題知識Hash庫Hash庫中進行查找;對查找的結果,根據匹配的結果個數進行倒序排列,展示給用戶。本發明在確保效率的前提下能夠有效實現“華夏文明”主題知識庫的檢索。
4.2.1 大大提高檢索效率
對于圖形的檢索方法研究較少,大眾熟知程度較低。而通過本文所述的方法,大眾在進行“華夏文明”視角下主題的相關知識檢索時,系統將快速計算出檢索條件Hash值,通過比對,能夠迅速列出檢索結果,大大提高檢索圖形的效率。
4.2.2 提高檢索準確性
本文采用提取特征點的方式,并進而計算出特征點連接的線段的角度值,進而計算出的Hash值具有唯一性,能夠大大的提高檢索準確性,同時,檢索結果根據權重進行倒序排列,對權重值大的檢索的結果進行優先展示,也在一定程度上包裝了檢索結果的準確性。
通過圖像識別的方式用于華夏文明視角下主題知識庫檢索分析,改變只能靠關鍵詞檢索的單一檢索方式,既提高了檢索的效率,同時保證了檢索結果的準確性,從而提高“華夏文明”視角下主題知識庫在用戶檢索中的效率和準確性,進而豐富信息檢索方法,對于華夏文明的建設發展具有積極的意義。