尹新富
(鄭州財經學院,河南 鄭州 450000)
基于網頁大批量數據自動錄入的實踐分析
尹新富
(鄭州財經學院,河南 鄭州 450000)
互聯網形勢下各行各業都實現了管理信息化,基于B/S結構的管理軟件非常流行,常常會出現通過瀏覽器向管理軟件錄入大量數據的情況。若這些數據已經以Word或Excel等形式存在,此時仍使用手工的方式一條一條進行錄入,不但效率低下,且容易出錯。而利用文章所述方法,可以讓計算機仿人工把這些數據快速自動錄入到管理系統中去,提高了錄入的效率,也保證了錄入數據的準確性。
B/S;管理系統;自動錄入;批量處理;二次開發
計算機已得到長期快速發展,各單位都有自己電子版的數據信息,各行各業的管理逐步信息化、網絡化?;贐/S結構的管理軟件非常流行,在實際運行過程中,常常會出現通過瀏覽器向管理軟件中大量錄入數據的情況。而這些數據又常常都以Word或Excel等形式存在,若因管理軟件沒有提供批量錄入功能,仍使用手工的方式一條一條進行錄入,不但效率低下,且容易出錯。若能對原系統進行二次開發,擴充原有系統的功能,就可提高錄入的效率,保證錄入數據的準確性。因為系統的安全性,在進行二次開發時,不可能直接對后臺數據庫進行操作,而只能通過原系統提供的錄入界面作為接口來錄入數據,也就是說,只能采用讓計算機仿人工錄入數據的方法來錄入數據,雖然有點笨,但和手工比起來,速度有天壤之別。
以“金水區人大選民登記系統”的數據錄入實踐操作為例,該系統采用B/S結構,電腦只要能夠上網,通過登錄管理員賬號,即可進行手工輸入。因系統本身沒有提供批量導入功能,雖然社區各單位提供的選民信息都是電子文檔,卻只能將選民信息手工錄入到該系統中,效率低易出錯,如何實現網頁上數據信息的自動填寫是提高效率及準確性的關鍵。
1.1 原系統分析
要想實現“自動錄入”,必須先了解原系統的工作過程。由于系統安全性的考慮,必須先登錄,然后才能執行相應的錄入操作。
不同社區有不同的登錄賬號。社區工作人員必須登錄系統之后,才能進行該社區的選民信息登記工作,登錄成功后,會顯示選民登記概況。
1.2 選民信息錄入
單擊“選民信息登記”按鈕,即可進入登記界面,進行選民信息的登記工作。這項工作操作簡單,只要會文字錄入即可操作,但數據量大,錄入工作非常辛苦,效率低,易出錯。雖然電腦中有電子版的社區居民信息,卻不能為系統所識別。在錄入過程中可能出現下面幾種情況:(1)居民年齡不到選民的法定年齡,其信息不能錄入到系統中。系統會調用Javascript顯示一個消息框,表單信息并不會提交到系統中去。(2)居民年齡已到,而且尚未錄入到系統中去,則可以正確錄入到系統中去。(3)居民曾經被錄入到系統中,再次錄入時會出現提示信息,錄入操作將會失敗。
1.3 軟件開發思路
本次應用開發時間短、任務重,為使軟件能快速投入使用,采用在教學中使用的可以高效開發Windows應用程序的“Microsoft Visual Studio 2010”作為軟件的集成開發環境,快速進行軟件開發。為使錄入人員可以在原界面中直接操作,軟件采用WebBrowser控件,其中顯示原系統的網頁頁面,另外新增加一部分界面,用于完成選民信息的自動錄入。
1.4 程序設計中的幾個問題
在進行程序設計時,要解決如下幾個問題:
(1)判斷當前所在的位置。頁面加載成功后處于什么樣的狀態,是進行用戶登錄,還是進行選民登記。這個可以根據頁面上是否有登錄按鈕來確定,不登錄,是不可能進行選民信息登記的。
(2)數據的采集及格式化。電腦中居民信息一般采用Excel文件來存放,信息量的多少一般不會和本系統的要求相一致,這需要對Excel文件進行簡單處理,從中刪除多余的數據項,然后將數據復制到文本文件中。這個文本文件的內容就作為自動錄入時的數據源。原始數據可能是不太規范的,必須對數據進行規范化處理,保證數據能按正確的值輸入到系統中去,這主要涉及性別、文化程序、民族、職業等,實際操作時,采用正則表達式可大大簡化操作。
(3)多線程的應用。選民登記數據量大都比較多,會運行較長的時間,為保證良好的交互效果,須采用多線程技術,后臺線程不斷地從文本文件中獲取數據,并進行數據的格式化,并檢測當前運行狀態,在允許時激活相應的事件完成界面數據的自動錄入。
(4)界面數據自動錄入。后臺線程不能直接更新界面數據,也就是不能直接進行數據的自動錄入,必須在指定的事件中進行處理。在該事件中,獲取規范化的數據,并填寫到對應的表單元素中,然后自動單擊“登記”按鈕,以便將信息錄入到系統中去。
(5)特殊情況處理。對于年齡不到法定年齡的,系統自動跳過該居民的信息登記操作;對于身份證錯誤的選民,因不能提交而停留在操作界面,此時可手動直接修改為正確的,再單擊“登記”按鈕,或直接“跳過”該選民信息;對再次錄入相同選民信息的,因原系統會自動進行處理,所以本系統不會對其進行處理。
軟件是在原登記系統的基礎上進行的二次開發,運行界面分成上下兩部分,上面部分和原系統的顯示完全相同,下面一小部分是新增加的功能部分。操作員既可以像過去一樣進行操作,就像新增加的部分不存在一樣;當然,也可使用新增的功能。可按原系統的操作方法輸入用戶名及密碼來登錄系統。若曾經登錄過系統,也可通過新增部分的“自動登錄”來完成。登錄成功后,單擊“選民信息登記”,即可進入登記界面自動錄入的相關操作了。
電腦中存放的居民信息一般不會和本系統要求的信息格式完全一樣,必須進行簡單的處理,按指定的格式存儲數據。在Excel中選民信息有6~8個方面的信息,其中前6項信息是必須的。Excel中信息的處理是很方便的,處理好后,復制選民信息,將其粘貼到記事本文件中,圖1就是粘貼的選民信息樣例。
若居民信息情況比較復雜,可輸入“單位或住址”及“戶口所在地”信息,然后將其復制到記事本中,這樣,在選民登記時,就會忽略如圖1和圖2中所示的“單位或住址”及“戶口所在地”信息。

圖1 Excel中處理后的信息格式樣例

圖2 粘貼到記事本文件中的選民信息樣例
本文通過一個實例較為詳細地展示了仿人工進行快速網頁數據錄入的思路及解決方案,對相同情況的問題有一定的參考價值,由于本人水平有限,解決有不當之處請批評指正。
[1]萬靜.基于Internet的構件信息系統[D].泉州:華僑大學,2000.
[2]顧艷艷.Proxy Cache的研究與實現[D].成都:電子科技大學,2001.
[3]賈笑飛.INTERNET上的相關數據庫技術研究及應用[D].鄭州:鄭州大學,2001.
[4]仲偉和.通用校園行政辦公自動化系統[D].阜新:遼寧工程技術大學,2002.
[5]禹斌.基于Web技術的數據傳輸實時監測系統[D].重慶:重慶大學,2002.
[6]孫靜波.網絡課程頁面在線生成管理系統設計與實現[D].北京:中國人民解放軍國防科學技術大學,2002.
Practical analysis of automatic data entry of Web page
Yin Xinfu
(Zhengzhou Institute of Finance and Economics, Zhengzhou 450000, China)
In Internet situation, all walks of life have realized informational management, the management software based on B/ S structure is very popular, often there will be a situation that a large number of data is input to the management software through the browser. If these data already exist in Word or Excel form, but we still use manual way enter them one by one, which is not only low efficiency, but also easy to make mistakes. While using the method described in this paper can make the computer artificially, fast and automatic entry the data into management system to improve the input efficiency and guarantee the accuracy of data input.
B/S; management system; automatic entry; batch processing; two development
河南省高等學校青年骨干教師資助計劃;項目編號:2014GGJS-268。項目名稱:鄭州地方高校技術技能名師工作室成員;項目編號:鄭教高﹝2015﹞70號。鄭州地方高校第七批教育教學改革工程項目;項目編號:ZZJG-B7029。
尹新富(1973— ),男,河南駐馬店,碩士,副教授,副處長;研究方向:智能儀器儀表。