文/鄭聃
在國務院印發的《促進大數據發展行動綱要》中,“大數據”被定義為:“以容量大、類型多、存取速度快、應用價值高為主要特征的數據集合。”不過,目前對大數據的通行定義是:“當前技術無法處理的數據集合”,即“無法在可承受的時間范圍內用常規軟件工具進行捕捉、管理和處理的數據集合,是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產”。可見,大數據是一種以應用為目的,具有一定的信息處理難度的數據集合。
目前,關于大數據的應用似乎更多地體現在生產、銷售以及娛樂服務等行業,“大數據”在行政執法中的角色定位即“大數據”是包含執法規律和未來違法趨勢的巨量零散數據的集合,通過對歷史數據的分析,行政執法部門可以獲取以一般分析手段無法獲取的且更清晰準確、更有預測價值的決策信息。
一是搭建數據平臺,實現煙草專賣管理信息化。為提升利用信息化進行科學監管的水平,去年,國家啟動了行業“專賣管理綜合信息系統”建設項目,并在北京、山西、安徽三地啟動“三統一”試點運行。根據《關于推進煙草行業專賣管理綜合信息系統一期項目建設的意見》,于2016年年底前專賣管理綜合信息系統全面上線運行。對此,行政執法部門可利用專賣管理綜合信息系統建設的重要契機,開展數據采集標準以及數據種類、數據存儲、傳輸、讀取形式等方面的有益探索,在不斷的實踐和總結積累中,逐步完善數據資源管理體系,健全大數據采集制度,明確信息采集責任,從而提升對煙草專賣管理信息數據的采集、傳輸、提取效能。
二是重視開放共享,實現信息交流數字化。在“大數據”時代背景下,越是零散的數據信息利用價值越低,若不公開和分享數據,便可能造成數據間的割裂,無法產生深度價值和綜合價值。只有通過開放共享,不斷匯聚融合零碎數據,才能產生從量到質的飛躍,展現出零散信息無法提供的“隱含信息資源”。因此,整合數據資源實現互聯互通是“大數據”應用的內在必然邏輯。同時,數據內含的“潛在信息”不會自動顯示,需要通過信息公開讓更多的數據使用者看到,集眾人之智,實現對數據內在資訊的深度挖掘。
三是完善分類管理,實現監管數據標準化。對海量數據進行分類是“數據信息挖掘”過程中十分重要的一環,每一起專賣案件都含有眾多類別的信息,從不同角度可以得出不同的案件線索,因此有必要完善數據在采集、共享、使用等環節的分類管理。例如一起真煙非法流通大要案,既可以從案件查獲環節進行分類,也可以從案件涉及的卷煙品牌進行分類,還可以從案件發生的區域進行歸類……越多角度的分類方法,其后的分析也將有越多維度的分析思路,從而得出更多、更精確的隱含信息。
四是推行數據分析,實現市場監管精準化。電商、快遞潛移默化地改變著固有的消費行為乃至消費習慣,消費者越來越習慣“宅”在家里“點”需求。為做好煙草專賣行政執法工作,煙草專賣局應當關注物流快遞渠道涉煙違法行為,利用快遞大數據肅清“假私非”涉煙違法問題。網絡制假販假行為無孔不入,傳統煙草專賣行政執法方式難以從根本上解決問題,需要從電商行為的主渠道供給中實施有效占領。淘寶、阿里巴巴官方對制假販假行為無法做到徹底肅清。利用物流快遞大數據肅清“假私非”涉煙違法問題,對于煙草網絡打假將會是一個極大的促進。涉煙案件的查處中一個很重要的制約在物流快遞的大數據信息不足和不充分,積累的經營者和消費者的信息、數據,在物流快遞大數據中反復的提取、驗證才是真實最有價值的資源。
所謂技術有限、應用無限,數據的規模不是目的,應用效果才是一切數據最好的歸宿。業務部門的“大數據”用在精準營銷上可產生“數字生產力”,那專賣部門的大數據如何應用呢?通過匯總分析違法行為相關數據,確定發生率最高的地域、時間段、卷煙品種、運輸方向等信息,最終模擬預測出最有可能發生違法行為的目標,形成行業“黑名單”,提高打擊精準度。當然,以上只是對顯性關聯數據的應用,真正的“大數據預測”還能通過尋找多個表面看似不相關的數據間的聯系,發現信息間的“同步”信號。因此,對大數據的應用要多挖掘數據間的關系,才可能發現數據背后潛在的“秘語”。