■ 四川省電力公司 涂 輝
中國產學研合作促進會信息網絡部主任 胡 勇
搭建互聯網信息整合平臺助力電力行業企業創新發展
■ 四川省電力公司 涂 輝
中國產學研合作促進會信息網絡部主任 胡 勇

中國電力企業信息化建設經過長時間的持續發展,現已初具規模。經過對目前國家電力系統信息分布狀況及信息表現形式進行深入研究發現,我國電力行業在內部信息系統管理和建設方面已自成體系,各類大型信息系統(如供電企業的生產管理系統、電力營銷系統,供電企業的ERP、EAM、設備管理系統等)正在企業的經營與管理中發揮著重要的作用,但對于互聯網外部動態信息的有效采集和整合相對還比較落后。
隨著互聯網的飛速發展,各種各樣的信息不斷大量涌現,信息的采集、傳播的速度和規模達到了空前的水平,信息是作為繼材料、能源之后的又一重要戰略資源,人們對信息的依賴性也越來越大。然而滾滾而來的各類信息大大超過了人們的處理能力和有效應用的需要,而真正有價值的信息被大量無用信息所淹沒,且被相互離散、分割,存在于不同的系統之中,形成了“信息孤島”。
如何幫助企業、集團領導在不耗費大量的時間和精力的同時就能快速準確地獲取想要的信息,掌握國內外產業動態和行業發展情況;如何幫助企業、集團相關部門快速整合產業鏈上下游的相關信息建立自己的知識情報庫,節省人力成本,是新形勢下企業不能回避的問題?;ヂ摼W信息整合平臺就是在這樣的背景下產生的。

互聯網信息整合平臺能夠自動對互聯網上的目標網站信息進行實時監測、采集和處理,自動完成信息的篩選、去重、分類、入庫并將各個網站中不同結構和表現形式的有用信息,按照統一和規范的結構進行整理、分類,形成高質量、便于利用和檢索的結構化數據庫。以面向電力行業企業的信息整合平臺為例,系統可分期分批整合集成國內外成千上萬個有關電力生產和消費、電力設備制造和銷售、電力安全和監管、電力科技和培訓……產業鏈的科技信息、市場資訊、供求信息、價格動態……自動形成海量的電力行業動態科技和經濟數據庫,方便企業相關人員檢索查找。
在信息整合的整個過程中,最核心的是信息采集和信息處理部分。信息采集要保證用戶感興趣的信息能夠被采集到,這就要求信息采集要有一定的廣度和深度。信息采集用到的技術主要有元搜索技術、網絡蜘蛛技術、站內數據庫檢索技術等。信息處理要保證按照用戶要求的結構提供用戶最需要的信息,需要將各種格式的信息結構化,并保證信息的有效性、準確性、及時性以及適應信息的變化情況。信息處理用到的技術,主要有去重、過濾、結構化、分類、聚類等技術。
目前,掌握互聯網信息整合技術并已經形成成熟的產品或服務的公司都是大中型公司,國外的有google、Autonomy,國內的有百度、TRS、海量科技、365Agent等,他們除在擁有大用戶量的搜索引擎或個別行業的垂直搜索上對用戶提供免費服務外,主要是對政府和大中型企事業單位提供信息整合服務,對個人和小企業在信息整合上沒有提供更多的服務。其他一些提供信息服務的公司,一般都是利用現有的搜索引擎和行業網站給用戶提供信息服務,其自動化程度還不高,屬于勞動密集型的傳統企業。
應用互聯網信息整合平臺,不僅可以為電力行業企業單位領導了解和掌握國內外相關領域的各種信息提供決策信息支持,增強組織的核心競爭力,平臺還依托海量的信息資源,既可以對內部人員提供信息檢索查詢的服務,又可以發布信息、展示企業形象、擴大企業的影響力、推動企業的創新活動等。
互聯網信息整合平臺除可以應用在電力行業外,還可以應用于其他行業和領域。如針對政府及相關部門的信息化建設與公眾服務的需求,可構建面向區域經濟、面向行業、面向公眾的互聯網信息整合平臺;針對企業對互聯網上產品、價格、供求、招投標等需求,可建立面向企業的信息整合平臺;也可根據特定用戶群體對網絡信息的集中需求,建立面向某一主題的互聯網信息整合平臺等等。
綜上所述,隨著國內乃至世界互聯網用戶的不斷增加和用戶水平的不斷提高,互聯網上會出現大量各種結構和類型的信息,用戶的需求是多元化的,對個性化的追求會越來越高,所以信息整合技術的應用會越來越廣泛?;ヂ摼W信息整合平臺作為一項科技和經濟的基礎信息化建設工作是適應時代發展的。平臺對應對新一輪的競爭、快速確立企業或集團在行業中的地位以及面對行業的新趨勢、新變化、新特點等具有十分重要的現實意義,對我國電力行業的發展也具有戰略性的深遠意義。
