賈曉博
(山西財經大學,山西 太原 030006)
物聯網指的是隨處可見的終端設備和設施,包括具有“內部智能”的傳感器、手機終端、工業系統、數字控制系統、家庭智能設施、視頻監控系統等,以及“外部啟用”的終端設備和設施。通過物聯網技術,能夠實現普通物體的信息交換[1]。目前,物聯網技術尚未廣泛應用于統計工作中。總的來說,目前的統計工作還停留在傳統的工作模式上,尚未實現自動化和信息化。傳統的統計工作在效率、成本、差錯率控制等方面存在諸多問題。近年來,國家統計部門大力推廣PDA數據采集技術,對提高工作效率有很大幫助。但是,PDA的數據采集技術仍然是基于統計人員的手工操作,并沒有從根本上改變傳統的數據采集方式,也沒有利用物聯網、云計算、人工智能等先進技術,發展迅速,前景廣闊。因此,為提高統計工作質量,提高統計工作的科學性和先進性,增強統計工作的有效性和可靠性,解決當前統計數據采集中存在的困難和問題,促進統計工作的科學化和現代化。這與傳統的信息采集單一、數據處理方式簡單、使用范圍有限有很大不同,在運用物聯網技術后,數據收集效率更高,提升了統計數據工作質量,提高了統計的有效性、可行性[2-3]。本研究著重探索物聯網技術應用于統計數據采集的技術和方法,將當前先進的計算機網絡技術與統計分析方法相結合,實現數據的自動化對當前統計工作的高效、準確、便捷,具有重要的現實意義。
物聯網是結合互聯網技術提出的。這是網絡的概念,將用戶擴展到所有商品上,使得用戶可以在線上進行信息交換和通信。目前,物聯網的發展是我國信息技術發展的重點之一。數據收集是物聯網的另一個重要組成部分,物聯網為測試和控制提供實時數據,這些數據是實驗室人員提供分析產品性能的重要依據,物聯網技術避免代碼重疊以縮短數據收集周期。這些對于數據收集系統的研究和設計具有重要意義。
條形碼技術是POS系統、EDI、電子商務及供應鏈管理的技術基礎,是物流管理現代化的重要技術手段。這是計算機管理和電子數據交換不可或缺的先端采集技術。通過計算機進行數據的維護,能夠順利完成商品價格的計算。針對條碼技術在工商業中廣泛應用的情況,本研究設計了更好的價格采集方案和相應的設備,以提高價格采集的效率。利用這些特點,我們可以得到相應的價格采集方法,即將光電掃描系統嵌入PDA中,直接掃描店內商品的條形碼,從而獲取價格信息。目前,在商場、超市等場所,很多商品在稱重時都會貼上條形碼,并據此進行價格結算。價格采集員在采集這些商品的價格時,可以利用條形碼掃描儀提高工作效率。
射頻識別技術通過無線電波的非接觸式快速信息交換和存儲技術,無線通信與數據訪問技術相結合,再連接到數據庫系統,實現非接觸的雙向通信,從而達到識別的目的。它用于數據交換,連接一個極其復雜的系統。在識別系統中,電子標簽的讀寫和通信是通過電磁波實現的。根據通信距離可分為近場和遠場。因此,讀/寫設備與電子標簽之間的數據交換模式相應地分為負載調制和反向散射調制。射頻識別掃描能夠提高掃描距離,能夠在遠距離的情況下,完成數據的識別和收集,通過此技術能夠使企業的各方面管理更加有效,從而加強制作行業和零售業之間的聯系,優化產業鏈條。它具有RFID技術的優點,可以縮短作業流程,使信息傳遞更加快速準確,提高庫存作業質量,提高配送中心的吞吐量,降低作業成本,實現物流跟蹤;但其成本相對較高,技術還不是很成熟,錯誤率較高;缺乏行業標準,缺乏相關法律法規;很容易引起隱私問題。
OCR((Optical Character Recognition)是指電子設備檢查紙上印刷的文字,檢測黑白的圖案來確定其形狀,并以文字識別的方法轉換為計算機文字的過程。也就是說,對于打印的字符,紙張文檔的文本被光學地轉換成黑白點圖像文件,圖像中的文本通過識別軟件轉換成文檔格式,并且通過字處理軟件進一步編輯和處理文字和圖形。
簡言之,OCR的基本原理是通過掃描儀將文件的圖像輸入計算機,然后計算機將每個字符的圖像取出,并將其轉換為漢字編碼。具體的工作過程是掃描儀通過電荷耦合器件CCD將漢字手稿的光信號轉換成電信號,再通過模數轉換器轉換成數字信號并傳送給計算機。計算機接收到的是手稿的數字圖像,圖像上的漢字可以是印刷體漢字或手寫體漢字,然后識別這些圖像中的漢字。對于打印字符,首先通過光學手段將文檔數據轉換成原始的黑白點陣圖像文件,然后通過識別軟件將圖像中的文本轉換成文本格式,供字處理軟件進一步處理。字符識別是OCR的一項重要技術
語音識別技術,也被稱為自動語音識別Automatic Speech Recognition,(ASR),其目標是將人類的語音中的詞匯內容轉換為計算機可讀的輸入,例如按鍵、二進制編碼或者字符序列。與說話人識別及說話人確認不同,后者嘗試識別或確認發出語音的說話人而非其中所包含的詞匯內容。語音識別技術最重要的是建立語音模板和比較語音信號的特征。在農貿市場環境下,由于各種噪聲的影響,語音模板的構建比較困難。語音數據越來越受到人們的重視。語音識別是一門交叉學科。在過去的數十年里,語音識別技術已經取得了重大進展,從實驗室開始走向市場。在未來,人們也會調整自己的說話方式,以適應各種識別系統。
由于中國地大物博,人員最多,有必要建立一個龐大的數據庫,收集當地農貿市場的價格信息。這項工作可以由原來的價格采集人員進行,他們將農產品及其價格以語音的形式上報到各自負責的地區,然后由專門的技術人員進行處理,制作出當地農產品及其價格的模板,形成最終端的分公司。他們在進入當地農貿市場話語權時,可以直接進行比較和選擇,將有用的信息過濾后轉化為標準文本信息向上傳遞。
物聯網的發展,歸根結底是給人們的生活帶來便利,降低生產成本,提高資源利用率。物聯網的發展,在現階段,并不是一定要刻意追求效益,主要取決于其長期的經濟效益和社會效益。由于對信息技術的需求不斷擴大,為物聯網的發展創造了最佳的發展環境。如今,我們鋪設在許多領域的傳感器設備,交通道路和城市中的視頻監控設備數量不斷增加,以及無線網絡熱點,為未來智能交通和智能城市的建設奠定了基礎,也是物聯網可持續發展的基石。
信息采集是多種技術在物聯網上的聯合實現,有效提高了數據采集量。與傳統的數據采集相比,物聯網技術在采集樣本量數據方面具有更高的價值,并且在數據丟失和缺陷方面也大大減少。
在數據采集過程中,數據信息整理分類可以識別缺失的數據信息狀態、輪廓、模糊度,以實現數據整理過程中的數據清理,保證數據信息的真實性。針對數據流在動態等方面的不同性能,可以通過概念漂移來檢測數據流,對數據流進行分類,劃分不同性能的數據流。
最后就是信息數據的處理,通過聯合統計數據技術和物聯網技術,在數據統計領域改進了傳統數據統計技術的采集、清洗和分類,整理不足之處,提高數據處理效率。
物聯網突破了傳統的物理設備與信息傳輸分離的思想,實現了物與物之間的溝通,體現了大融合的理念,具有重大的戰略意義,現有的溝通主要是人際溝通[4]。如今,全球通信用戶已接近飽和,發展空間有限,物聯網所涉及的通信對象更多是“物”。從傳感器到終端裝置,從傳輸網絡到信息處理中心,是個受益頗多的領域,物聯網是繼計算機、互聯網、移動通信網絡之后,成為另一個信息產業的浪潮。物聯網是通信網絡的延伸,能使我們的社會更加自動化,降低生產成本,提高生產效率,提高企業的全球化競爭力;借助通信網絡,可以隨時獲取更及時的信息和遠程信息;它能使我們的生活更方便;使生產更加安全,及時發現安全隱患,進行安全監控;它可以提高整個社會的信息化水平[5]。它在物聯網在提高信息傳遞效率、改善人們生活、提高生產力等方面都將發揮重要作用,尤其是在數據采集和數據處理方面發揮了巨大作用,并且在理論上有很大的應用價值[6-7]。
在現代科學技術的推動下,先進的物聯網技術被廣泛應用于社會發展的各個行業,有效提高了數據采集、數據整理和數據分析的準確性。因此,本文對物聯網技術在統計數據采集中的應用價值進行了分析和探討,新技術的開發和應用需要不斷更新和變化。由于其自身精確的數據采集和高效地處理特點,改變了傳統數據采集對空間和時間的限制,減少了數據丟失,以及不完善的采集,在開展當前的數據采集工作中顯示出更加高效準確的應用價值,具有很高的現實意義。