張配豪
只需一掃,便可將書本、路牌上的字轉化到手機上任意編輯;出國旅行,手機掃描一下,便可將看不懂的外文翻譯成漢語……不但免費,而且簡單、好用的特性,使其在沒有推廣的情況下,贏得了萬千用戶交口稱贊。日前,由曹天明創立的貓起來科技將這一“拍照取字”的夢想變成現實。其App也迅速成為OCR市場的新寵。
“拍照取字”是一款用手機掃描書上、菜單的文字,然后進行電子化排版、翻譯的軟件。這款App的特點是頁面簡潔,功能簡單,沒有廣告,用完即走。該項目通過所有的渠道,匯總每一個用戶的反饋信息,平均每周更新一次版本。
靈感來源于一次度假
曹天明是一個“不安分”的人,從“360”出來后一直在找尋創業方向。曹天明又是一個“愛貓”之人,去年3月注冊“貓起來科技有限公司”,他每月在貓身上要花一兩千塊,心里想著不平衡,一定要把這個錢從貓那里掙回來。正因為如此,公司的標志是一只紅眼、披披風、背著兩把劍、殺氣騰騰的黑貓,稱之為“劍客靴貓”。
起初,曹天明并未想清楚創業方向。“貓起來”最初的計劃是做貓糧,調研發現頻次太低不是剛需,決定改換方向。后來,打算做一款車前出行類APP,提供天氣、車壓監測等出行前信息,結果做了兩三個月,創業止于PPT。
2017年5月,曹天明去日本、泰國、印度尼西亞旅游了一個月散心,在國外他發現因為語言不通,特別不方便,看到文字就想拍下來搞清楚。于是,他靈機一動,想到要做一款掃描翻譯的軟件“拍照取字”。
說干就干,從6月17日開始討論這一“拍照取字”的想法到iOS上線了第一個版本,只用了一個星期。“拍照取字”這款產品頁面簡潔,用戶通過App或者小程序掃描文字即可生成文檔,自動進行歸類。“不做廣告,不給用戶浪費時間,用完即走”這是該產品給自己的定位。到了10月,該產品已有3萬多用戶,海外用戶占比33.4%,4個月總共發布22個版本。
資金對一個創業初始團隊來說無疑是一個至關重要的影響因素。由于用于數據流編程的開源軟件庫越來越多,如Microsoft CNTK和Accord.Net,機器學習愛好者能夠以極低的成本進行研究和學習。然而,并非所有問題都能得到解決,因為并非一切都是已知的。為了實現產品創意,要平衡預算,公司仍有很長的路要走。起初,曹天明的整個團隊就只有一個半人,全職的曹天明,以及兼職的“阿甘”,辦公地點在曹天明的家里。但是很快,投資人的電話就紛至沓來地打了過來。新進創投洪奕領投,史玉柱巨人網絡跟投,120萬天使輪融資到位,這無疑給曹天明和他的團隊吃了一劑“定心丸”。
聚焦學生人群和商務人士
OCR技術是光學字符識別的縮寫(OpticalCharacterRecognition),是通過掃描、拍照等光學輸入方式將各種書籍、報刊、票據、卡證及其他載體上的文字轉化為圖像信息,再利用文字識別技術將圖像中的文字轉化為可以編輯的結構化數據的過程。簡單來說,就是讓文字信息快速從非結構化圖像轉化為可以在電子媒介上直接使用的數據的技術。
比起英文為主體的OCR識別技術,漢字的OCR識別明顯面臨著更大的難關。英文字母加數字識別字符集只有62類,但中文識別字符集達到20000類之多。加上影響OCR識別效果的因素眾多,包括復雜背景、低分辨率、多種字體、非均勻光照、圖像退化、字符變形、透視變形、多種排列方式等等,OCR識別技術研究困難重重,這直接導致了國內目前具有OCR識別技術自主知識產權的團隊少之又少,只有不到十家,其中就包括易道博識。
相對于傳統的手工錄入方式來說,OCR智能錄入具有強大的優勢,OCR識別的速度遠快于手工錄入,提升用戶體驗度,減少手工輸入時間,OCR技術可以為用戶提供高效率、低成本的數據采集方案,從而為業務快速發展提供有力的支撐。
OCR技術可廣泛應用于大量文字資料、檔案卷宗、銀行票據、文案的錄入和處理領域,非常適合用于銀行、證券、保險等需要對大量票據表格進行數字化的行業。實際上,這一技術很早就已經被應用了,但是應用行業比較小眾因此沒有機會在互聯網圈子露臉,比如安防監控,車牌識別(沒錯,你開車被拍違規那就是這個技術)等。今年大家覺得技術和市場都成熟了,因此開始在互聯網圈頻頻露臉,再加上Deep Learning概念興起,漸漸水漲船高。
“貓起來”現有團隊成員7人,主要都是技術、產品設計,團隊有北郵、北大等名校畢業的成員,用曹天明的話說是:“錢少,加班多,事多,但是因為產品大家都忍了”。當前,該公司正在和票據公司合作,希望能夠訓練人工智能,開發出一款專門針對票據識別的產品來。
產品主要針對的用戶群體是學生人群和商務人士。學生的作業、筆記、錯題本,經掃描后可轉化為線上文本,方便后續的歸納整理;商務人士在掃描、傳輸文件時,只需使用該款APP轉錄到線上再開展后續操作即可。
此外,某用戶若想把書中內容分享給朋友,也可使用此款應用掃描并錄入相應文本信息,并標注出重點信息再做相應分享。當數據量足夠大時,“拍照取字”也會添加相應的人工智能屬性。
將“走心主義”作為口號
在曹天明看來,好的產品在戰略上要分為“兩步走”。首先要讓用戶“用爽”,獲取足夠的黏性。第二部,以OCR作為起點后,拍照取字要給人工智能提供足夠的數據供其練習,并從B端企業收費。
“由于OCR所使用的都是開源代碼,底層技術其實都是一樣的。真正拉開差距的,是CEO后續對產品用戶人群的定位及商業戰略的思考,大家拼的是產品而非技術。”曹天明如是說道。
目前OCR掃描方面做的比較大的企業有漢王和掃描全能王,前者是上市公司而后者則已積攢了一批可觀的用戶數量。漢王主要是跟政府、企業合作來盈利。而拍照取字后續也在思考通過平臺上積攢的用戶數據變現,比如切向幼教市場。
而目前OCR掃描技術所碰到的最大難題絕非技術,就是用戶的市場教育,“很多人并不知道有這樣的產品存在。”所以如何推廣是團隊要解決的問題。而目前拍照取字還是專注于產品的研發,并沒有將資金投入推廣,“就是將這款產品放到App Store 上,讓用戶自行下載。”
貓起來將“走心主義”作為口號,“拍照取字”這款App處處可見其用心之處。不管是書本、路牌還是紙質文件上的文字,用戶只要通過App或者小程序掃描文字即可生成文檔,將“非計算機語言文字”轉化為“計算機語言文字”,方便用戶自動進行歸類、管理,從而省去了大量文字錄入和文件管理工作。
同時,“拍照取字”免費版還支持PDF文件掃描功能,無論是身份證等證件,還是各種卡,需要掃描時都能通過App一鍵搞定,不但可以自動識別、裁剪邊緣,還可以一鍵導出PDF,第一時間分享給需求方。
在公司墻上貼著用戶對“拍照取字”的流言,好評差評都有。對用戶反饋信息的重視,是曹天明覺得自己產品能夠走下去的根本原因。“未來,貓起來還將基于AI技術,推出一款聚焦財經數據的新產品。相信不久的將來,這款新產品將給用戶帶來更多驚喜。”曹天明說。