張雪燕
摘 要: 基于RFID技術的船舶交通流統計系統進行特征趨勢統計時未采用大數據技術,提取的特征數據不精確,增加特征統計的難度,導致船舶交通流特征統計效率較低。因此設計基于大數據的船舶交通流特征趨勢統計系統,通過用戶管理模塊進入系統,采用Excel格式對數據實施輸入與輸出操作,通過海事子模塊、港口子模塊以及船舶子模塊實現宏觀特征分布統計與微觀特征條件查詢;軟件部分通過數據處理、數據擬合以及擬合優化檢驗獲取最優擬合函數,分析船舶交通流的特征趨勢。實驗結果表明,所設計系統能夠準確統計船舶交通流特征趨勢,具有效率高的優勢。
關鍵詞: 大數據; 海事子模塊; 港口子模塊; 擬合函數; 特征趨勢; 統計系統
中圖分類號: TN973.1?34; TP274.2 文獻標識碼: A 文章編號: 1004?373X(2018)22?0166?04
Abstract: The big data technology is not adopted for feature tendency statistics in the RFID technology based ship traffic flow statistical system, as a result, the extracted feature data is inaccurate, and the feature statistic difficulty is increased, which leads to the low statistical efficiency of ship traffic flow features. Therefore, a ship traffic flow feature tendency statistical system based on big data is designed. After entering the system from the user management module, input and output operations of data are implemented in the Excel format. The maritime sub?module, port sub?module and ship sub?module are used to obtain distribution statistics of macro features and realize condition query of micro features. In the software part, the optimal fitting function is obtained by means of data processing, data fitting and fitting optimization detection, so as to analyze the feature tendency of ship traffic flow. The experimental results show that the designed system can obtain accurate ship traffic flow feature tendency statistics, and has the advantage of high efficiency.
Keywords: big data; maritime sub?module; port sub?module; fitting function; feature tendency; statistical system
伴隨海上交通運輸業興起,海上船舶交通流規模迅速擴大,各種特征趨勢繁瑣復雜,嚴重威脅航道安全、降低海上運輸效率,因此確保海上船舶交通流安全、有序調度十分關鍵[1]。傳統基于RFID技術的船舶交通流統計系統進行特征趨勢統計時未采用大數據技術,提取的特征數據不精確,增加特征統計的難度,導致船舶交通流特征統計效率較低。現有研究表明,大數據技術被廣泛應用在船舶交通流特征趨勢研究方面,可以從海量數據信息中獲取有效的特征分析數據[2]。從該角度出發,本文設計基于大數據的船舶交通流特征趨勢統計系統,彌補傳統系統統計性能差的缺陷,實現海上交通航道安全、有序運行。
1.1 系統硬件設計
本文基于海事主管機關、港口部門以及船舶公司的各自需求設計基于大數據的船舶交通流特征趨勢統計系統。該系統硬件功能模塊構成圖如圖1所示。
1.1.1 用戶管理模塊設計
用戶進入本文設計的系統,選擇符合自身需求的子系統,接著輸入正確的登錄信息,正式進入符合需求的子系統。
1.1.2 數據輸入輸出模塊設計
系統采用Excel格式對數據實施輸入與輸出操作,采用在登錄界面設置數據輸入接口的方式,將船舶交通流大數據輸入到所構建的數據庫[3];采用在子系統設置數據輸出接口的方式,實現條件查詢結果、分布統計結果的輸出。
1.1.3 海事子模塊設計
船舶交通流某個特征的條件查詢、某個特征或多個特征排列統計可通過海事子模塊完成。
1) 條件查詢功能。海事子系統可根據船舶的微觀特征實施查詢,同時存儲查詢結果[4];以數據統計的方式保存海上船舶交通流的特征。
2) 排列統計。船舶交通中船舶相關參數的排列統計可通過海事子系統進行獲取,可得到圖形化顯示結果同時實施存儲。
3) 船舶流量及組成統計。發揮海事子系統的功能,可以實現交通流數據中的交通流量、船舶種類、船舶尺寸等數據的統計[5]。
1.1.4 港口子模塊設計
按條件查詢與港口交通流特征的統計可通過港口子模塊進行獲取。港口子模塊功能設計如圖2所示。
1.1.5 船舶子模塊設計
基于船舶的某個微觀特征能夠查詢其他微觀特征,同時存儲查詢結果,這是船舶子模塊的主要功能[6]。該模塊只能對船舶的靜態特征實施查詢。由于船舶的靜態特征不隨時空條件轉換而改變[7],隨機輸入一個參數,即可獲取對應的全部特征值。
1.2 系統軟件設計
通過數據處理、數據擬合及優化檢驗和確定最優擬合函數等過程[8],實現基于大數據的船舶交通流特征趨勢統計,進而完成系統的軟件設計。具體過程如下所述。
基于上述方法得出船舶交通流特征的最優擬合曲線,則船舶交通流的特征值可通過擬合曲線、擬合分布函數特征進行獲取[10],分析其函數特征得出船舶交通流的特征趨勢,進而完成系統軟件的設計。
為驗證本文系統在船舶交通流特征趨勢統計方面具有優勢,對天津海事局提供的天津港2009年船舶交通流數據信息展開實驗分析。該數據相對來說比較全面、內容豐富,用來驗證本文系統性能具有說服力。該實驗數據以Excel形式存儲,共包含23 257艘次。
實驗從精確度、效率兩方面驗證本文系統對于船舶交通流特征趨勢統計的性能,采用本文系統對天津港2007年1—8月份的船舶到港數據進行處理,獲取的結果如表1所示。
分析表1能夠看出,本文系統能夠對船舶交通流數據進行精確處理,且將上述結果與真實數據進行對比,結果基本吻合,說明本文系統可用于船舶交通流特征趨勢的統計。為進一步驗證本文系統的優越性,引入基于AIS的船舶交通流統計系統、基于RFID技術的船舶交通流統計系統進行精確度、效率對比實驗。三種系統獲取的統計精確度對比結果如圖3所示,統計效率曲線對比如圖4所示。
分析圖3可知,本文系統對5個月份的船舶交通流數據進行特征趨勢統計實驗獲取的精確度較高,均在99%以上,與真實情況基本吻合。實驗結果表明,本文系統進行船舶交通流特征趨勢統計精確度高達99.8%,相較其他系統而言,具有精確度高的優勢。
分析圖4可知,根據三種系統的效率曲線走向,可清晰看出本文系統位于曲線圖的上方,效率均值在99%左右,最高可達99.8%,總體呈上升趨勢。實驗表明,本文系統在船舶交通流特征趨勢統計方面的效率明顯。
本文設計基于大數據的船舶特征趨勢統計系統,能夠準確、高效地對船舶交通流特征進行統計,為海上交通流特征趨勢統計提供有效的手段,對于提高海上船舶運輸效率、維護海上交通秩序、保障船舶安全運行具有積極作用。
參考文獻
[1] 劉軍華.大數據視野下統計數據質量演變的信息回歸、分布與趨勢[J].統計與信息論壇,2015,30(9):7?11.
LIU Junhua. Information regression, distribution and trend of statistical data quality evolution in the perspective of big data [J]. Statistics & information forum, 2015, 30(9): 7?11.
[2] 肖潤謀,李彬,陳蔭三.基于大數據的高速公路運輸趨勢分析[J].交通運輸工程學報,2015,15(5):85?90.
XIAO Runmou, LI Bin, CHEN Yinsan. Trend analysis of expressway transportation based on big data [J]. Journal of traffic and transportation engineering, 2015, 15(5): 85?90.
[3] 曹麥,倪蘋,顧杰.京張高速公路大數據的統計分析[J].調研世界,2016(12):50?52.
CAO Mai, NI Ping, GU Jie. Big data statistical analysis of Beijing?Zhangjiakou expressway [J]. The world of survey and research, 2016(12): 50?52.
[4] 薛振宇,胡航海,宋毅,等.基于大數據分析的縣公司綜合評價策略[J].電力自動化設備,2017,37(9):199?204.
XUE Zhenyu, HU Hanghai, SONG Yi, et al. Comprehensive evaluation based on big data analysis for county electric power company [J]. Electric power automation equipment, 2017, 37(9): 199?204.
[5] 孟東霞,陳剛,許美玲.基于電信大數據的流動人口數據特征分析[J].中國新通信,2016,18(19):109.
MENG Dongxia, CHEN Gang, XU Meiling. Data feature analysis of migrant population based on big data of telecommunication [J]. China new telecommunications, 2016, 18(19): 109.
[6] 李金昌.基于大數據思維的統計學若干理論問題[J].統計研究,2016,33(11):3?10.
LI Jinchang. Several theoretical problems in statistics based on the idea of big data [J]. Statistical research, 2016, 33(11): 3?10.
[7] CHIAKI K, YOSHIO S, NORIYUKI K, et al. Cerebral data analysis system for large scale numerical simulation of nuclear power plant [EB/OL]. [2007?11?25]. http://jolissrch?inter.tokai?sc.jaea.go.jp/search/servlet/search?5008699&language;=1.
[8] 羅繁明,楊海深.大數據時代基于統計特征的情報關鍵詞提取方法[J].情報資料工作,2013,34(3):64?68.
LUO Fanming, YANG Haishen. On the statistical features?based information keyword extraction method in the era of big data [J]. Information and documentation services, 2013, 34(3): 64?68.
[9] 胡巧玲,茹金平.基于大數據分析的人口遷移量預測模型仿真[J].計算機仿真,2014,31(10):246?249.
HU Qiaoling, RU Jinping. Simulation on the prediction model for volume of population migration based on big data analysis [J]. Computer simulation, 2014, 31(10): 246?249.
[10] 鄧杰,錢雪忠,錢恒,等.基于特征選擇的統計最優樣本大小算法[J].計算機應用研究,2014,31(12):3535?3538.
DENG Jie, QIAN Xuezhong, QIAN Heng, et al. Statistical optimal sample size algorithm based on feature selection [J]. Application research of computers, 2014, 31(12): 3535?3538.