侯宇騰
摘 要:《鐵路運輸房建設備大修維修規則》(以下簡稱《規則》)是鐵路建筑段工作的重要依據,是職工日常工作中的必備資料。隨著智能手機的普及,在手機上實現《規則》的電子化、檢索自動化很有必要。本文討論如何設計依托手機微信客戶端的《規則》檢索系統,方便職工日常學習,進而提高現場作業時查找相關規范的效率。
關鍵詞:鐵路 微信 檢索效率
中圖分類號:F424.2 文獻標識碼:A 文章編號:1672-3791(2018)04(b)-0026-02
1 引言
《規則》作為鐵路房建系統重要的規范,其紙質書有攜帶不便、易破損、檢索效率低等弊端,筆者希望能夠設計開發一個使用智能手機平臺,可以隨時翻閱、快速檢索的《規則》。
通過開發一個接入微信平臺的后臺系統可以快速高效地實現功能設想,同時只需在微信APP中關注一個公眾號即可使用全部功能,擁有很高的傳播效率。
1.1 檢索實現原理
建立《規則》知識庫,當得到用戶檢索請求時,通過算法篩選出與提問關聯度最高的一組內容并回復給用戶。可以將檢索的實現歸納為幾個部分:構建知識庫、索引、搜索、消息收發。依托知識庫建立索引庫,收到用戶的檢索關鍵詞后,對詞語或句子進行分詞,然后從索引中找出與這些詞相關的內容,再分析查找到內容與用戶檢索請求信息的相似程度,找出關聯度最高的一組內容返回,如圖1所示。
1.2 信息發送接收實現原理
使用者與微信公眾平臺對話的過程是:用戶將消息發送給服務器;服務器收到消息,使用后臺接口配置信息中的URL地址,將消息傳輸至后臺服務器;后臺服務器完成消息的接收和分析,返回結果給用戶。
2 系統設計
2.1 功能設計
本系統依托微信平臺,不需開發客戶端。后臺系統需具備標簽功能,方便新增、修訂、刪減。當知識庫修改后,自動應生成新的索引庫,防止造成兩個庫不同步。
2.2 分詞實現
對知識庫錄入內容進行預處理,使檢索系統能夠分析內容含義。由于Lucene檢索工具具有查詢、索引和不針對中文的文本分析功能,故使用IK分詞組件對錄入的文本信息進行分析優化,提高檢索命中率。
2.3 索引實現
建立索引的過程為:通過IK分詞器和Lucene,創建對象;指定索引路徑;使用JDBC對數據庫進行訪問,將對象添加到索引庫中。
2.4 搜索實現
Lucene通過統計文檔得分來判斷檢索結果與輸入關鍵詞的關聯程度。在查詢時,首先基于布爾模型來縮小待打分文檔的范圍,然后利用空間向量模型對結果進行打分。
根據得分判定關聯程度,之后解析到對應記錄的ID;返回從數據庫中獲得ID對應的記錄。
2.5 交互實現
由于微信采用XML格式的數據包傳輸,所以,本系統中使用開源框架dom4j和XStream對XML進行解析。公眾平臺服務器收取消息,完成處理,以XML結構的消息反饋給用戶結果完成一次檢索。
2.6 后臺管理
后臺管理實現如下功能:知識庫建設,管理員可完成知識庫的增項、刪項、改項;更新索引,當知識庫數據發生變動后,數據庫將通過更新索引功能維護索引庫,保證數據的統一。
3 結語
《規則》的電子化、移動化,檢索功能的自動化,解決了職工作業中使用、檢索不便的難題。
參考文獻
[1] 石凱,諶志群.基于微信的自動問答系統研究[J].計算機時代,2014(9):10.
[2] 宋萬鵬.短文本相似度計算在用戶交互式問答系統中的應用[D].中國科學技術大學,2010.
[3] 張長恒,何鈞,劉亮.基于微信多客服的參考咨詢系統設計與實現[J].圖書館理論與實踐,2016(12):77-83.