張棲瑩
摘 要:當前,我國信息化技術實現了迅猛發展,在各行各業都逐步滲透,并廣泛應用,呈現出十分良好的應用效果。在空間信息領域有效引入文字識別技術,結合具體情況,有效利用車載移動測量系統可以切實有效的采集更高清的街景影像,并通過相應的算法,在最大程度上有效針對特定位置展開相對應的定位,并進行相對應的文字識別,之后,通過相對應的數據庫檢索相關內容,并匹配與之相適應的相關地理信息,然后在街景地圖上標注文字,通過這樣的方法就可以自動化的標注街景影像。
關鍵詞:街景地圖;文字識別;地理信息數據庫;地圖自動標注
1 概論
當前,信息化技術,計算機技術實現了突飛猛進的發展,由此推進各個行業的信息化程度也逐步提升,當前,計算機文字識別技術有了更良好的發展和完善,促使相關行業的工作效率和工作質量有了更大程度的提升。在具體的應用過程中,街景地圖能夠結合具體需要,為移動道路智能系統提供相對應的基礎數據,也可以供給相對應的街道以及其周圍環境全景圖像,通過這樣的方法,用戶能夠有切身感受,如身臨其境,體驗到瀏覽地圖的真實體驗,與此同時,也能夠從巨量的信息數據庫中選擇最有用的信息。
2 街景影像采集及預處理
2.1 采集街景影像
通常情況下,在具體的應用過程中,車載移動智能系統提供相對應的街景影像,這個系統結合具體的需要有效運用GPS技術集合激光掃描儀、IMU、相機和里程計等相關設備的優勢和特征,把相關內容有效融合在GPS時間系統,通過這樣的方法,保證系統內部的數據可以在根本上保持一致。里程計、GPS和IMU等相關設備獲取的信息,對其進行優化完善,可以用其導航,這樣一來就可以更精準有效的獲取系統中的位置數據。
2.2 三維透視變形矯正
在具體的應用環節,有效利用車載移動測量系統,能夠很明顯的看出,所有的街景影像都具備三維透視變形。由于街景圖片基本上全部都是來自于車載移動測量系統,在這樣的情況下,如果車輛不同,所采集的圖片就會呈現出很大的差別,如果在相同的情況下,有一定意義上的變形問題,也情有可原。
結合具體需要而拼接和矯正原始街景影像,可以為下個環節提供相對來說更清晰,沒有發生變形的街景影像。與此同時,對其進行拼接,圖像的文字識別效率有很大程度上的改善,工作效率有極大的提升,值得指出的是,這種拼接方法只能用在無分叉路的街道。
3 文字區域定位
3.1 用顏色聚類法初步提取相關的文字區域
這種方法所涉及的內容主要是指在彩色圖像像素要根據顏色的相似度分成多種多樣的類別,在這樣的情況下所獲得的圖片在顏色方面有著很大差別。因為大多數的時候,自然場景下的文本,有著相對來說更相似的顏色和灰度,但是和背景進行對比,其對比度比較顯著,所以在這樣的情況下,要結合實際情況應用顏色聚類方法實現文本定位。有針對性的利用同區域文字顏色類似的現象,分割相對應的色彩空間,使相關圖像劃分成不同類型的圖層,在其中選取出相對應的連通區域,在這樣的情況下,深入細致的分析和探究區域內顏色分布和區域外接框幾何特征,通過這樣的方法就可以有效定位文字。
3.2 文字分布法進行文字區域定位
對于顏色聚類法獲取的相關圖片,實施相對應的初步篩選,把像素比較小的文字剔除出去,有效采取這樣的措施,可以使搜索的范圍得到顯著的縮小,確保識別的效率,能夠使識別效率得到更有效的提升。針對每一個圖層而言,要對其有針對性的展開圖像預處理工作,其預處理工作涉及彩色圖像灰度化、圖像去噪等一系列相關方面的內容。
預處理完相關圖像以后,要結合具體情況,搜索相關的連通域,之后再有針對性的探尋連通域的外接矩形,并針對具體情況判斷它的長寬比、面積大小等,并經過不斷的篩選,去除與要求不相符合的圖形,然后有針對性的結合文字的空間分布的相關性,來實施進一步的篩選。
4 文字識別與自動標注
4.1 結合詞庫開展文字識別
為進一步大幅度提高具體的識別效率和準確率,首先要從街景地圖中的候選區的第1個矩形出發,并且按照順序依次順延,在某一個矩形中識別出某一個文字,在這樣的情況下,要針對該矩形進行詳細的標記,除此之外,也要把同一張圖片上的圖層進行有針對性的標注,在這樣的情況下,可以更有效的顯示該區域已經被充分識別,沒有必要進行重復識別。
4.2 判斷識別效果并實施人工協助軟件識別
由于街景圖片有著十分顯著的復雜性,不確定性特點,所以在具體的檢測過程中,它所呈現出的識別結果和正確率往往不能達到100%,所以在這樣的情況下,要想確保該技術能夠充分應用于實踐,要針對識別效果進行切實有效的判斷,并結合具體的內容對其實施人工糾錯。同時,要有針對性的結合街景影像數量龐大的特征。
5 結語
綜上所述,通過上文的分析和論述可以很明顯的看出,對街景地圖中基于文字識別的自動標注進行簡要研究和論述,是十分重要而且必要的。在空間信息領域結合具體情況,切實有效的使用這種文字識別技術,可以在更大程度上及時收集到更高清更精準的街景圖像,與此同時,利用與之相對應的科學算法,可以針對相關文字區域進行自動化的識別和定位,另外也可以通過相關數據庫中的檢索信息進一步標注在街景地圖上。
參考文獻:
[1]A.Mishra and K.Alahari.Top-Down and Bottom-Up Cues for Scene Text Recognition[J].In Proc.CVPR,2012.8(5):58-60.
[2]柏宏飛.場景圖像文字提取方法研究與應用[D].復旦大學,2015.8:96-97.