王敏 汪瑋 張世國 王毛翠 方海濤 竇煒明



[摘 要] 利用數據分析方法從大量數據中發掘潛在價值,具有重要的研究意義和實際價值。文中以《省級氣象裝備動態管理系統》數據庫中數據為研究基礎,詳細介紹了數據開發應用方向、過程和實現方法。首先,介紹了《省級氣象裝備動態管理系統》的系統結構和數據分類,分析了數據類型和特點;然后,展示了數據分析框架和數據預處理方法,結合業務工作提出了應用方向和實際需求。最后,利用多元線性回歸分析方法,建立了倉儲分析、裝備性能分析及站點運行情況分析數學模型,闡述了各技術指標在業務工作中的預期作用,對提升氣象裝備的信息化管理水平具有指導意義。
[關鍵詞] 氣象裝備;數據開發;信息化;線性回歸
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2016. 07. 090
[中圖分類號] P413 [文獻標識碼] A [文章編號] 1673 - 0194(2016)07- 0193- 03
0 引 言
氣象裝備是現代氣象業務的重要組成部分,是實現氣象業務現代化的基礎,是基層臺站綜合氣象業務的重要環節。隨著綜合氣象探測系統建設規模的不斷提高,對氣象裝備的信息化管理提出新的需求[1-4]。2013年安徽省大氣探測技術保障中心承擔《省級氣象裝備動態管理系統》(2013 -2014年中國局關鍵技術集成項目)的開發、設計工作。該系統從氣象裝備業務實際需求出發,應用物聯網信息跟蹤技術,根據業務流程分類設計用戶角色功能,利用激光掃描和NFC識別技術采集氣象裝備各類狀態、屬地等變化信息,實現省級氣象裝備動態管理。
信息是新經濟的導向和潮流,是社會廣泛關注的熱點。大數據中隱藏著巨大的機會和價值,并在金融領域、物流、社交、醫療等領域獲益匪淺[5-7]。在物聯網技術、NFC識別技術支撐下,《省級氣象裝備動態管理系統》數據庫數據量快速增長,在2年多的時間內收集和存儲了2萬多條信息,并以每年幾千條的速度逐年增加。雖然數據庫中的數據量與大數據的海量數據相差甚遠,但是這些數據涵蓋了多種氣象探測裝備全生命周期內狀態信息、地域屬性信息、流轉信息等。如何將這些信息進行有效提取、分類和關聯性分析,轉化為管理者關注的信息,對提升裝備信息化管理水平具有重要意義。
1 系統結構及數據分類
1.1 系統結構
《省級氣象裝備動態管理系統》可用于全省氣象觀測裝備采購、供應、檢定、維修、流轉、報廢、統計和分析等方面,系統的總體架構如圖1所示。該系統利用移動系統、NFC等多種感知設備將氣象裝備信息由網絡存儲在數據庫中,并通過服務層的功能控制實現個人事務管理、設備庫存管理、設備狀態管理等業務應用。
1.2 數據分類
系統數據庫采用SQL Server2008開發,2013年運行至今,產生數據量約2.3萬條。表1為《省級氣象裝備動態管理系統》的主要數據項目和數據量。
從數據開發應用的技術角度來看,數據主要分為5類:
(1)裝備類型及狀態統計信息:記錄氣象裝備的類型、數量、狀態信息,如氣象裝備的型號、生產廠家,在用、待用、待檢等狀態信息,可用于指導氣象裝備的采購、調撥、制定倉儲計劃等。
(2)裝備地域屬性信息:記錄了裝備在流轉過程中地域屬性的變更信息,便于建立氣象裝備運行狀態和地域屬性之間的聯系。
(3)裝備技術性能信息:記錄了氣象裝備的檢定、維修、報廢等信息,為對比分析氣象裝備的特點、性能提供基礎數據。
(4)裝備時空特性信息:記錄了氣象裝備的技術性能與應用季節、地域等信息,便于建立時空關聯性。
(5)站點運行狀態信息:記錄氣象臺站觀測裝備的檢定、維修信息,可分析站點運行狀態,實時監控站點的運行情況。
1.3 數據特點
《省級氣象裝備動態管理系統》數據庫中的數據具有數據量較大、信息多樣、地域范圍廣、持續時間長、數據質量不同等特點。信息在全省2 000多個氣象站產生,操作人員分為省、市、縣三級多個角色,信息涵蓋每個進入系統的氣象裝備在全生命周期內的操作信息,包括狀態信息、地域屬性信息、流轉操作信息等。同時,數據庫中數據質量參差不齊,在系統應用初期有部分測試數據未及時刪除,部分操作用戶誤操作信息等。