李力
隨著計算機網絡的發展和大數據的興起,全世界的信息量呈爆炸性增長,網絡上浩如煙海的信息中人工搜索不僅耗費大量時間和精力,而且也很難確保精準。因此,對桂林市產業競爭情報服務平臺的理論基礎、體系建設、系統開發、系統構成進行研究,建設高度智能化的各種子系統,實現桂林產業情報的共享,不僅可以為政府的科學決策提供選擇的依據,而且對于企業開展技術創新、應對外界變化及提升產業競爭力具有十分重要的意義。
(一)平臺的整體框架
產業競爭情報的體系建設主要以協同原則和易推廣原則為主。為了適應桂林市產業情報的特征,該平臺以基礎網絡為紐帶,利用互聯網信息為服務模式,實現數據自動采集、產業數據智能分析、產業研究、競爭戰略分析、競爭情報服務等模塊的前臺實時展示;按照建立的不同產業鏈,實現資源的深度整合、智能歸類為核心的數據劃分,以及數據加工、分析和發布的完整處理流程,最終完整構建了產業競爭情報服務體系。如圖1所示。
(二)平臺的功能定位
企業、產業、政府作為產業競爭情報的三種基本主體,結合產業實際情況,在構建競爭情報服務平臺時,充分考慮政府和企業兩方面用戶,提供一站式、零距離的服務模式;用戶不僅能夠獲得情報信息產品,還能夠接受高層次、個性化的專題咨詢研究成果,實現資訊實時發布、產業數據統計、趨勢分析圖表展示、專題咨詢研究成果推送、情報互動交流等功能,實現全面高效的服務內容。
(三)平臺的系統構建
1.互聯網信息自動采集子系統的構建
采集子系統根據互聯網的多種來源且不同類型的數據,構建了整站下載、欄目采集、元搜索、論壇采集、定向采集等引擎,對不同來源進行自動化的跟蹤、下載、數據解析,具備全面的信息采集能力。運行原理如圖2所示。
整站下載引擎和欄目采集引擎應用于行業新聞類網站、企業網站、博客類網站的自動化信息采集,這類采集頁面比較規范,不需要人為手工配置數據解析模板,引擎就能自動分析網站結構和頁面信息,比較易于實現采集的完成。


元搜索引擎應用于各種公開的搜索引擎檢索結果的數據采集,采集后系統自動對多種搜索引擎的結果進行合并和查重,并自動完成信息結果的分析,得出較為完整的數據。
論壇采集引擎對于各種論壇的主帖和跟帖進行采集,用戶設置需要采集的內容后,系統就能通過向導式的學習模型并依托向導式的自動分析,實現論壇數據的全面采集。
定向采集引擎能夠采集各種B2B和B2C電子商務網站的格式化數據,包括廠商的供需信息、產品的價格及銷量數據、物流信息等,采集的信息經過自動處理,儲存于產業研究平臺之中,可以直接進行圖表化分析、統計分析、趨勢分析的研究。
2.產業數據智能分析工具集的構建
產業數據分析工具集包含兩類分析工具:智能語義分析工具和結構化數據統計分析工具,主要用于對海量數據的自動處理和圖表統計,可以極大的減輕情報數據的管理和統計工作,使研究人員從繁重的情報加工和數據整理工作中解放出來,將更多的精力投入到面向重點支撐的專題研究課題中。
智能語義分析工具利用采集的數據,經過一系列的標引、關鍵詞、摘要、自動分類、聚類、正負面信息識別、主體識別等服務后,為信息建立起了全文索引,經過規范化處理的信息統一保存入庫,最終為用戶進行信息瀏覽、輿情分析、內容分析、統計分析之用,可以大大提升情報分析人員的海量數據處理能力,極大的降低服務體系對信息維護人員的數量要求。如圖3所示。
結構化數據統計分析工具主要對采集子系統和人為手工發布的信息進行全自動化處理,無需用戶的干預,信息就能依次經過查重查新、自動標引、計算文章關鍵詞、計算文章摘要、自動歸類文章、聚類分析、文章負面識別、主體識別等處理過程,最終進入產業研究平臺文獻庫中保存,并在競爭情報服務網站中發布,供政府和企業的用戶進行瀏覽與檢索。如圖4所示。
3.產業研究平臺的構建

平臺的主要用戶是情報采編人員和課題研究人員,根據用戶設置的產業鏈結構,分成多個產業研究子平臺,不同平臺用于各自的競爭情報子庫,也在不同產業鏈之間提供可以交換統計分析的數據。平臺構建的模塊包括人工數據采集與加工、簡報制作、產業數據統計分析、情報服務內容推送、系統安全管理等,具體如表1所示。

4.競爭戰略分析子系統的構建
競爭戰略分析子系統主要功能是在情報研究和產業研究的理論與方法指導下,通過使用計算機輔助分析模型和流程,對定性定量情報數據進行量化分析、對比分析、綜合計算評估,形成各種情報決策支持報告。