袁鑫攀 彭成 盛鑫海


摘要:隨著現代化教育的快速發展,多媒體課件的數量出現爆炸式增長。海量課件帶來檢索低效、準確率低等問題。論文設計基于Solr的多媒體教學課件的云檢索系統,實現了課件的高效靈活的緩存功能、在線檢索、查重和管理功能、高亮顯示結果功能,并且通過索引復制來提高可用性。
關鍵詞: 課件檢索,Solr,課件去重
1 引 言
隨著現代化教育的快速發展,盡管高校有一定程度的課件管理系統,海量課件檢索效率和精度都不足。Solr[1]是一個獨立的基于Lucene[2]搜索應用服務器,它對外提供類似于Web-service的API接口。用戶可以通過http請求,向搜索引擎服務器提交一定格式的XML文件,生成索引;也可以通過Http Get操作提出查找請求,并得到XML格式的返回結果。
2 系統結構
2.1 功能結構
基于Solr的課件云檢索系統的功能結構分為5個部分。1)在線檢索:對各類課件進行不層次需求的檢索功能;2)在線查新:檢測課件的重復情況;3)分類瀏覽:瀏覽各種類別的課件;4)高亮顯示:高亮顯示檢索的結果;5)對比查看:對比課件的相似性證據。
2.2 軟件結構
系統軟件結構如圖1所示。1)數據層:提供數據源,包括數據庫和索引文件。2)核心業務層主要是依賴Solr框架,利用分析器對文檔切分,建立分布式倒排索引;并且能夠提供關鍵詞檢索服務。3) 用戶應用層實現用戶與系統交互。
3 系統實現
3.1索引文件的創建和更新
1)配置參數:a)配置索引性能參數,修改 solrconfig.xml文件;b)配置索引結構參數,修改Schema.xml(/opt/solr/conf/schema.xml) 文件,定義fieldType、 fields、copyField等索引的主體字段。c)更改schema.xml (/opt/solr/conf/schema.xml) 文件,使分詞器起到作用。……