北京石油附中 殷逐云
二維條碼的新用途
北京石油附中 殷逐云
信息需要輸入計算機才能進行后續處理。現在,手寫筆跡只有通過照相機、掃描儀來輸入。但裝訂好的筆記本、試卷很難拍照掃描,文字識別率也很低。將二維條碼印刷在紙上,在筆式攝像機上安裝筆芯。手持攝像機書寫,書寫過程中攝像機將二維條碼拍照下來,并通過USB/藍牙/WIFI傳入計算機。計算機識別二維條碼就可以得到攝像機的位置,從而得到筆跡的電子坐標。
二維條碼;筆式攝像機;手寫筆跡
教育大數據正在迅猛發展,這是因為教育面對的是一個個學生,因此,教學必須做到以人為本,多方面、多維度來跟蹤和研究每一位學生的學習行為數據,從而找到各自的問題,并予以針對性的解決。
現在城市里的學校,每個教室都有計算機、投影儀,基本上每位老師、學生都有計算機,查詢資料、講課都沒有問題,但是每天都會大量書寫,比如試卷、筆記,這些信息是大數據的最重要部分,卻很難方便地輸入計算機。目前是通過照相機、掃描儀來輸入。這導致3個問題,1是很多卷子是裝訂好的,掃描困難繁瑣,而且中間變形厲害,圖像變形甚至缺失。2是試卷、筆記都是有順序的,掃描拍照后是獨立的jpg圖片,必須將圖片和實物一一對應,很繁瑣。3是計算機收到的是圖片,筆劃丟失潦草、皺褶、臟點會使得OCR識別率很低,而很多情況下文本是需要的。依靠人工當然可以處理這3個問題,但由于試卷、筆記太多,老師、學生又有很多其它事情,很難做到。最終就是學生手上有大堆試卷和筆記本,每次查找都很費事,丟失也十分常見,老師對每個學生的信息掌握不全,大數據分析也就十分困難。
上述問題的核心在于手寫筆跡如何電子化,這可以利用二維條碼和筆式攝像機來解決。
二維條碼是按照一定的數學公式將各種元素,如點、短線、長線、折角等形狀組合后產生的圖像,在橫向和縱向同時表達信息,能在很小的面積內表達大量的信息,已在各行各業廣泛使用,如微信、支付寶等等。
二維條碼必須通過攝像機拍攝后才能解析其信息。目前的筆式攝像機很多,價格也很低,稍加改造就可以用于手寫筆跡的采集:將筆芯嵌入攝像機,以便書寫時留下油墨筆跡;改變形狀,以方便握持;筆芯尾部增加壓力傳感器,書寫時產生的壓力可以啟動攝像機。
首先將一個個不同的二維條碼印滿整個紙面,保證攝像機運動到任何地方都至少可以拍到一個條碼。
由于紙面上還有原有信息,不能被二維條碼遮擋。一種解決方法是選擇占用面積十分微小的二維條碼,布置在紙面的空白處,優點是使用常規油墨,缺點是如果空白處太小,二維條碼還是會放不下,所以要預先分析紙面內容的分布。由于攝像機拍攝面積很大,并且紙面內容通常不會太密,所以二維條碼通常還是可以放下的。
另外一種方法是利用紅外隱形油墨來印刷條碼。人眼只能看到360-720nm波段的光線,這種油墨在可見光范圍內是無色的,肉眼不可見,但在紅外波段如850nm則是黑色的。普通油墨在可見光范圍內是有色的,在紅外波段是看不見的。目前的攝像機都可以拍到紅外光,紅外隱形油墨價格也很低,這樣就完美解決了條碼和紙面內容的沖突。
攝像機拍到圖像后,可以先存儲在筆內,或者實時通過USB/藍牙/WIFI發送到計算機上,這些技術已十分成熟。
計算機收到圖像后,根據條碼產生公式,對圖像進行逆運算,解析出條碼信息。攝像機連續攝像,每張圖片都會解析出一個條碼,由于每個條碼的印刷位置是已知的,將各個位置連起來,就恢復了筆跡。二維條碼信息量很大,除了包括位置,也包括了頁碼,計算機可以根據頁碼,將本頁的原有內容以圖片方式顯示出來,然后再將筆跡顯示在其上面,這樣用戶在計算機上既看到了紙面原有內容,也看到了筆跡,和實際紙面完全一致。
由于紙面上本來就要印刷內容,多印刷些條碼也不增加成本。
這種解決方案優點很多。首先是價格很低。其次是無需培訓:使用者書寫時,筆尖接觸紙面就會自動開啟攝像機,沒有任何額外的操作。再次,攝像機只要拍攝到一個條碼,計算機就可以計算出筆尖位置,所以即使紙張上有皺褶、臟點,對計算的影響也很小。最后一點是本頁的原有內容圖片是用word/ PDF等生成的,和實際紙面情況無關,所以非常清晰干凈,紙張上的皺褶、臟點都不會顯示出來。
計算機還可以對筆跡進行ICR(智能筆跡識別)識別,得到文本文件。攝像機內部是有時鐘的,所以每個圖片都有時間,計算機也就知道了每個筆劃的書寫時刻。常見的OCR識別(光學字符識別),比如對書本、車牌拍照掃描后的圖像的識別,由于文字是標準體,所以識別率很高,接近100%,但對手寫筆跡就不行了,因為手寫筆跡通常很亂,連筆、丟筆劃的情況也很多。ICR則將字符的筆劃順序也考慮進去,大大提高了識別準確率。
這個產品一旦上市,在學習中會有很多用途。
首先是筆記本,學生可以將所有筆記都存儲到計算機,還可以進行ICR識別。由于變為了計算機文件,大家可以方便的交流。老師、家長也可以隨時了解學生的情況。
其次通過藍牙/WIFI,可以隨時將筆跡數據傳到教室的計算機,學生不用起身,在座位上就可以回答問題,其筆跡可以通過投影儀顯示出來。由于藍牙和WIFI都支持多個終端,所以可以多個學生同時回答,大大節省了課堂時間。
試卷也被收集進入計算機,老師、家長可以對學生的多個試卷進行分析。
由于知道筆跡的時間,老師可以輕松地知道每個學生在各個題目所花的時間,從而知道學生的難點,進行針對性的指導,還可以對試卷進行進一步的改進。在外國人、小學生學習寫字時,可以方便地知道其筆劃順序是否正確,避免倒插筆。
老師在課堂上用word/PPT講解,經常會加入新的內容。黑板上書寫的內容擦掉就全沒了。可以將word/PPT和條碼一起打印出來,課堂上用本產品在紙面上書寫,所寫內容通過藍牙/WIFI傳入計算機,和原有word/PPT文件合在一起,并實時投影。
總之,由于手寫筆跡可以方便地電子化,且每個筆劃的時間都準確地獲得,就解決了很多問題。
如果攝像機再加上錄音功能,還可以在書寫時同步錄音。由于筆劃含有時間,錄音文件也含有時間,使用者在計算機上選中某個筆劃,就可以方便的找到其對應的錄音。

附圖1