999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于百度人工智能的拍照切題系統設計

2021-03-15 07:01:33吳旭東羅榮良史庭蔚陳云
電腦知識與技術 2021年3期

吳旭東 羅榮良 史庭蔚 陳云

摘要:近年來教育行業借助著互聯網的蓬勃發展,智能化和信息化的程度大幅提升。而教師對于紙質試卷的錯題、難題整理依然存在著效率較低的問題,基于百度人工智能拍照切題系統的設計充分利用人工智能技術,對圖片自動進行畸變校正處理和百度OCR圖文識別,并通過訓練好的EasyDL平臺對題目的題干和選項進行分類,更好地滿足多種不同形式的教學,有效提高教師效率和教學效果,成為人工智能+教育背景下教師進行教學任務的好幫手。

關鍵詞: 百度人工智能; 畸變校正; EasyDL; 百度OCR; 文本分類

中圖分類號: TP181? ? ? ? 文獻標識碼:A

文章編號:1009-3044(2021)03-0199-02

Abstract:In recent years, the education industry has greatly increased the degree of intelligence and informatization with the vigorous development of the Internet. The design of the Baidu Artificial Intelligence (AI) camera-based question cutting system makes full use of AI technology to automatically correct distortion and Baidu OCR image recognition, and classifies question stems and options through the trained EasyDL platform to better meet the needs of different forms of teaching and learning. Improve teacher efficiency and teaching effectiveness, and become a good helper for teachers to carry out teaching tasks in the context of AI + education

Key words:Baidu AI; distortion correction; EasyDL; Baidu OCR; text classification

引言

教育培訓作為我國教育行業重要組成部分,在互聯網浪潮下不斷向信息化、智能化方向轉型,實現了利用圖片進行識別搜題的題庫系統,但識別搜題結果未達到預期目標。就這一問題,本文提出了一種提高圖片搜題識別率的技術方案,利用畸變校正技術[1]對問題圖片進行校正后調用百度OCR進行圖文識別,調用訓練好的EasyDL平臺文本識別模型對文本信息題干、選項進行分類,裁剪出試卷中各個題目,作為預處理后的圖像來進行識別搜題。

1 系統相關技術

1.1 EasyDL開發平臺

百度自主研發的飛槳平臺為從事深度學習行業的開發人員提供了一整套工具。目前飛槳平臺有開源版和企業版,本文利用開源版本中的EasyDL平臺。飛槳平臺具有快速的請求處理能力以及人性化的操作界面,極大地改善了用戶的體驗。

EasyDL是一個對文本、圖像等進行識別并生成算法模型,還能夠精準匹配用戶識別功能需求的服務平臺。該平臺的操作界面清晰簡潔,平臺自動生成的算法模型對用戶透明,對大多數沒有深度學習基礎的用戶十分友好。在該平臺下,用戶只需要簡單的上傳數據并對相關數據打上標簽,就能夠輕松獲得一個專屬的算法模型。

1.2 透視矯正

OpenCV作為一款主流的圖像處理函數庫,給開發者提供了豐富的機器學習和計算機視覺方面的諸多算法,在圖像識別以及圖像處理領域得到了廣泛應用。函數庫中的Canny邊緣檢測函數和霍夫直線檢測函數[2]專門用于獲得圖片輪廓,可用于計算圖片區域的定位以及版面區域的劃分。

為了對圖片進行更有效的二值化,圖片需要去噪聲預處理,使用非局部平均去噪算法(NL-Means)對圖片進行去噪處理,使圖片在去噪后能夠最大限度地保持清晰度且不丟失細節。其中,函數庫中的cv2.fastnlmeansdenisingcolored方法為對彩色圖片進行去噪處理一種解決方法。

對圖片進行二值化處理,一張彩色圖片需要變成灰度圖之后才能進行二值化。每張圖片的顏色都可以表示為像素點構成的像素矩陣。灰度化是指將一張彩色圖片中的每個像素點的RGB值變為相等的過程,該值就是需要的灰度值。二值化就是根據設定的灰度閾值,將灰度圖中高于閾值的灰度值修改為1,低于閾值的灰度值修改為0的過程。二值化的作用是使圖片中的黑白輪廓更加明顯。常用函數庫中的cvtColor方法對圖片進行灰度化,使用threshold方法對灰度圖進行二值化。

在同一平面內,若干平行線通過該平面的投影后相交的一點稱為滅點。滅點可以表示出三維立體的三個方向,對在二維圖像中構建三維立體極為重要。試卷輪廓的四角坐標,可作為imutils.perspective.fourpointtransform(透視變換)方法的四個參數,用于對圖片進行透視矯正。

1.3 圖像文字識別

百度AI平臺提供的圖文識別技術能夠獲取附帶文字位置信息的識別結果還[3]。

2 系統設計

本系統構架如圖1所示。

圖中各流程說明如下:

2.1 圖像預處理

本系統使用OpenCV庫,先對上傳圖片中不規范書卷進行透視矯正,針對雙面試卷進行左右分割,然后除噪、二值化預處理。

2.1.1 透視矯正

上傳的圖片會因為人為拍攝的因素而出現傾斜的現象,極大影響了圖像識別,因此本系統需要針對傾斜的照片進行透視矯正預處理。

使用OpenCV庫中的Canny邊緣檢測函數和霍夫直線檢測函數,在原圖中找到試卷輪廓中四角的坐標,利用透視滅點原理將透視圖轉換為正視圖,并根據四個點進行裁剪圖像,繼而得到規整的試卷圖像。

2.1.2 雙面試卷分割

百度OCR是按照從左到右的原則對雙面試卷進行識別,而按照人類的閱讀習慣是同頁內容優先,自左向右再自上而下閱讀。由于兩者讀取順序不同,會直接導致識別結果以及分割結果的不同,所以需要對這種試卷進行左右分割。

檢測出雙面試卷中存在的空白區域,以該區域的中線切割源圖像,具體步驟如下:

導入源圖像,使用OpenCV工具對該圖像進行二值化預處理。根據預先設置的位置截下感興趣的區域(ROI),獲得ROI區域每一列黑色像素的比例ArrayRate。遍歷ArrayRate找到所有連續白色中列數最多的區域,即得到一個連續并近似純白的區域[4]。藍色為起始,紅色為重點,默認藍色和紅色正中間是所要的截取線,如圖2所示,還原比例后,通過截取線將雙面試卷截取為左右兩部分。

2.2 圖像識別

本系統選用了百度OCR通用文字識別帶位置版,用于獲取附帶文字位置信息的識別結果。

2.3 文本分類

EasyDL經典版支持創建8種模型:單標簽文本分類、情感傾向分析、多標簽文本分類、聲音分類、視頻分類、圖像分割、物體檢測和圖像分類。本系統是基于EasyDL平臺[5]的單標簽文本分類技術的模型,經過訓練后可用于區分試卷中的題干與選項。具體流程分為5個步驟,分別是:

1) 創建模型,確定模型名稱,并填寫模型的功能描述。

2) 準備數據,上傳數據集,并對數據集加上標簽,按照標簽對數據集進行分類。

3) 訓練模型,選擇對應的數據標簽進行模型訓練。訓練完成后查看模型評估報告,然后對模型功能進行校驗。

4) 迭代模型,結合模型評估報告和校驗結果不斷擴充數據,再通過調整訓練數據和算法進行多次訓練,得到較好的模型效果。

5) 發布模型,將訓練完成的模型部署在服務器上。

2.4 切割試卷

每個經過百度OCR處理后的圖片返回的識別結果對象包含文本內容Text、文本位置Location,其中Location中又包含了top、left、height、width四個位置信息。通過文本分類模型,對題干與選項進行標記,使用以下步驟來劃分題目:

1) 如果某一行被判斷為題干,則表示該行為新題的區域。上一題的所有內容(該內容包括文本和位置信息)已經全部保存在一個question content集合中。

2) 將上一題的question content集合插入result集合后,清空question content集合并開始新題內容的保存。

識別對象被正確地歸到一道題中時,利用四個位置信息得到一個整體的區域,如圖3所示。

3 結論

本文深入研究了試題的拍照識別與分類過程中所遇到的問題。針對圖片上傳不規范、識別準確度較低等問題,通過百度人工智能技術、畸變校正以及EsayDL平臺的綜合運用,設計了該系統,大幅提高了試卷錄入、分類的效率,減少了教師的工作量。具有較高的研究價值。

參考文獻:

[1] 唐維,任國強.基于射影矩陣變換的名片透視圖像矯正[J].電腦知識與技術,2013,9(25):5711-5715.

[2] 周雨楠,張俊偉.基于Tensorflow和OpenCV的手寫體閱卷系統[J].電子世界,2020(13):99-101.

[3] 唐濤,馬澤.基于OCR的空間坐標自動提取——以廣東省清遠市清新區不動產存量數據整合為例[J].江西科學,2018,36(6):1024-1028,1038.

[4] 魏傳義,陳勤,張旻.基于投影的文本圖像版面分割算法研究[J].現代計算機(專業版),2016(10):33-38.

[5] 劉洋,史煜,曹雪倩,等.自動化機器學習在眼部疾病識別及分類中的初步應用[J].中國數字醫學,2019,14(3):44-45,49.

【通聯編輯:唐一東】

主站蜘蛛池模板: 国产精品人成在线播放| 在线不卡免费视频| 在线日韩日本国产亚洲| 久久久精品国产亚洲AV日韩| 亚洲色图狠狠干| 国产剧情一区二区| 最新日本中文字幕| 伊人大杳蕉中文无码| 特级aaaaaaaaa毛片免费视频| 99久久99这里只有免费的精品| 伊人AV天堂| 有专无码视频| 中文无码精品A∨在线观看不卡 | 999福利激情视频| 亚洲视频色图| 国产一区二区三区日韩精品| 99久久亚洲精品影院| 成人一级免费视频| 国产极品粉嫩小泬免费看| 日韩麻豆小视频| a亚洲视频| 国产精品冒白浆免费视频| 久久久久国产一区二区| 2019国产在线| 亚洲综合专区| a级毛片免费在线观看| 成年女人a毛片免费视频| 国产午夜福利在线小视频| 小说 亚洲 无码 精品| 五月丁香伊人啪啪手机免费观看| 亚洲精品欧美重口| 色精品视频| 日韩高清成人| 凹凸国产熟女精品视频| AV天堂资源福利在线观看| 国产欧美日韩在线一区| 国产精品永久久久久| 91在线无码精品秘九色APP | 欧美97色| 欧美在线三级| 欧美精品另类| 在线看片国产| 精品亚洲欧美中文字幕在线看| 亚洲不卡影院| 国产成人精品免费视频大全五级| 蜜桃视频一区| 丰满人妻一区二区三区视频| 亚洲第一精品福利| 久久久噜噜噜久久中文字幕色伊伊 | 久久久久国产精品熟女影院| 色综合成人| 久久99热这里只有精品免费看| 国产日本欧美亚洲精品视| 久久熟女AV| 国产欧美在线| 久久亚洲精少妇毛片午夜无码 | 最新亚洲人成无码网站欣赏网 | 国产性猛交XXXX免费看| 欧美一级夜夜爽www| 欧美啪啪一区| 国产成人精品在线1区| 日本午夜在线视频| 国产成人夜色91| 国产乱子精品一区二区在线观看| 国产人人射| 亚洲精品图区| 在线精品亚洲一区二区古装| 国产精品内射视频| 欧美v在线| 精品久久国产综合精麻豆| 成人免费午夜视频| 久久亚洲中文字幕精品一区 | 亚洲侵犯无码网址在线观看| 欧美另类精品一区二区三区| 九一九色国产| 热99精品视频| 久久综合亚洲色一区二区三区| 国产chinese男男gay视频网| 国产精品毛片一区| 久久这里只有精品2| 免费激情网址| 亚洲av无码专区久久蜜芽|