丁海驁
“移動互聯網真正影響我們,是在2007年。我們應該感謝喬布斯,因為在那一年,他重新發明了手機?!痹谟蒚estin主辦的第二屆NCTS中國云測試行業峰會上,Testin總裁徐琨在演講和接受記者采訪時,金句頻出——這位2000年左右還是一名程序員的IT“資深”人士,對于整個IT行業的生態和生存環境具有非常敏感的直覺。
的確在最近一個階段,移動互聯網作為IT能力的載體,在很大程度上正在改變IT技術的研發趨勢和應用模式。更重要的是,其也正在重構整個人類社會的商業體系:所有的商業機構都希望能夠利用移動互聯網開發屬于自己的移動應用,幫助企業重新定義自身與價值鏈成員之間的關系、商家與用戶之間的關聯,從而建立屬于自己的業務場景和商業邏輯,與市場上的對手拉開安全距離。
“中國企業在應用移動互聯網方面大致可以分成三個層次:頭部的企業非常領先,例如BAT;中間層存在一些科技化程度沒有那么高的傳統企業,例如有些銀行;而底層則是那些還處在刀耕火種時代的商業組織,他們人數相對很少,雖然他們在商業上非常成功,但基本沒有應用IT技術,例如一些餐飲、美容企業。但是有趣的是,在現在這個階段,可能是在5到10年內,所有這些企業都會同時進化成一個新的公司,會實現完全的信息化改造,進而實現數字化、互聯網化?!毙扃f。
而問題是:雖然各行各業都開始做自己的APP,但是與IT專業的軟件系統提供商不同,這些應用的開發者和提供者本身對于如何保證產品的質量,存在技術和能力上的明顯不足。于是在 2011年,Testin成立了——一家旨在為超過百萬的企業及開發者提供測試、安全、推廣及AI數據采集與標注服務的公司。
“Testin在2011年加入這個行業的時候,我們抱著一種直覺:希望用不同的方式做測試這件事情。因為我們原來是做互聯網的。我們認為將測試與互聯網結合,一定能夠不一樣。所以我們當時給自己定名叫做云測,那是在2011年——當時云服務還不被大家理解?!盩estin云測,就是Testin核心的測試業務,專司為用戶提供測試服務,從而滿足范圍越來越廣、復雜程度越來越高的應用測試需求。
事實上縱觀測試行業,從最初的人工手動測試,到后來的工具測試,再到目前市面上主流的自動化測試,整個行業在技術和流程上,基本已經進入到了一個成熟和穩定的階段。而徐琨結合互聯網做測試的模式,最終融合了AI——在本次會議上,Testin正式發布全新AI測試產品iTestin。
“如果世界上有輪子,那么就不應該再重新造一個新輪子。問題是測試這個行業,到處都是新輪子,但是都不是好輪子,所以我們才會想到要重新做一個輪子,它要更加智能?!毙扃麖娬{“自動化測試”實際是個“偽命題”,因為在他看來,測試的過程,就是不斷重復一個動作,完成同樣的操作,而每一個新開發的功能,就需要從頭完成一次重新的測試。而所謂的自動化測試程序,當測試環境、界面、場景發生了變化,那么其實現起來將是非常困難的。“今天的真實情況是,當應用開發高速迭代的情況下,各個公司——包括BAT這種公司——大量使用人工來進行測試,因為人工測試顯然速度更快。今天我們推出的iTestin是我們的一個探索和思考——有沒有可能讓測試工具可以像機器像人一樣,即使界面和環境發生了改變,它還能認識?!?/p>
在現場的功能演示過程中,由于iTestin融合了自然語言處理、文本識別、圖標識別等技術,因此測試人員只需要用自然語言即可實現測試編程:測試人員只需在界面中輸入點擊、等待、檢查、長按、輸入等自然語言的文字描述,后臺的AI就能準確實時的在真機上進行完整無誤的操作和相關指令,完成測試自動化操作。
例如,用戶只需要輸入“點擊搜索”的中文指令,iTestin 就能自動在APP當前頁面中檢測并識別出搜索圖標,并完成該圖標的點擊操作。這與傳統的測試腳本需要大量的人工介入,通過手工框選目標控件來實現腳本錄制和維護相比,極大降低了腳本錄制的難度,也極大提升了產品易用性和腳本維護效率。就如徐琨強調iTestin的特點:會中文就能寫程序;會用手機就可以測試。
“從技術角度理解,AI產業有三大要素:算法、算力和數據。這是三個生產要素。從我們的角度來看,第一,Testin擁有一個30人的AI團隊,他們的工作就是嘗試各種各樣AI的算法,解各種各樣子任務,各種各樣具體的技術問題,因此在算法層面我們具有相當的人才優勢?!盩estin CTO陳冠誠認為,iTestin短期內很難被復制的重要原因,一方是是Testin在算法方面具有絕對的人才優勢,同時,數據也是眾多同類同行難以超越的重要因素?!癟estin在以往的工作中,累計測試次數超過2億多次,一次測試就會產生一些數據,那么我們產生過2億多次測試數據:比如說這是一個什么樣的APP,每個頁面是什么樣的截屏,每個頁面上有什么樣的字體……數據越多,所能夠覆蓋到的場景就越豐富,準確度就越高?!痹诖诉^程中,Testin采集了20余萬張APP UI截圖,同時基于Testin數據的數據標注服務,標注了百萬級別的文字和圖標,再結合數據增強技術,構建了測試業界最大規模的千萬級數據集用于模型訓練,從而打造了基于深度學習的OCR文字識別和圖標識別引擎。

“我們內部專門做過評測,以OCR文字識別這一具體功能來講,Testin OCR模型文字識別精度超過了97%,全面超越了其他互聯網公司提供的高精度OCR服務?!标惞谡\說。而對于常見的“搜索、分享、返回、菜單”等類型圖標的識別,Testin 的圖標識別引擎則能夠實現了95%以上的識別精度,尤其是針對自定義圖標,Testin實現了基于深度學習的“以圖找圖”算法,通過圖標智能匹配實現了95%以上的自定義圖標識別精度。
徐琨說:“所有的行業都值得再做一次,而我們就是希望把測試這個行業再做一次?!?h3>寫在最后
技術改變世界的同時,也在改變我們認識世界的方式。將AI引入到程序開發,也許為時尚早,但是用這樣的角度去考慮問題,也許提升整個IT行業的效率,甚至會影響未來IT產業的結構,以及人類與IT技術之間的關系。“我絕對相信未來能夠實現智能測試,而且這也是我們新產品將要嘗試的方向。其實我覺得未來程序也應該能夠自動化,沒有那么難。只是可能會需要一些時間?!毙扃f。