文 / 本刊記者 黎沖森
愛數智慧提出二八原則,即幫助車企解決底層80%的標準數據和20%的定制數據,以更好的性價比和更快的速度來幫助車企完成整個智能化模型構建工作。
作為一家對話式AI數據服務商,愛數智慧擁有海量對話式AI訓練數據集,比如擁有超過150000小時自有數據集,其中超過90000小時對話式AI訓練數據集,能幫助AI開發者快速提高模型性能,從而加速智能產品市場化進程。愛數智慧還自主研發了SaaS智能化數據標注平臺,并于今年4月推出了針對AI開發者的開源社區MagicHub.io,賦能生態。
至今只有5年創業歷史的愛數智慧,發展非常快,在語音識別、自然語言處理、語音合成、計算機視覺等人工智能領域已嶄露頭角,服務業務涵蓋智慧金融、智慧出行、智能社交、智能家居、智能終端等五大行業,應用場景覆蓋車載語音助手、消費級機器人、語音商務及客戶服務、智能家居控制、語音審核、智慧醫療等,能提供50多種語言的數據采集和標注服務。
作為演講嘉賓,愛數智慧創始人兼CEO張晴晴參加了由中國汽車工業協會主辦的2021中國汽車論壇,并接受了采訪,分享了其“從零到一”的創業進階經驗。
眾所周知,智能語音等在車載場景中非常重要,而愛數智慧為正在智能化轉型的車企提供相關的底層數據服務。
“在車載場景里,核心之一是人機交互。對于人機交互,我們強調對話式,要自發式、自然式地與車進行交互,而不是很死板的命令控制方式進行交互。這里面最重要的是形成對話式,但這會比命令控制式的交互難度大很多,會加大機器識別語音的難度。”張晴晴說,“我們一直在對話式AI領域深耕,著手人和機器以及人和人之間進行自然式對話。我們希望將最真實的數據反饋到車廠,應用智能化模型優化理念,幫助他們更好地迭代出更智慧化的語音操控系統。”
據張晴晴介紹,愛數智慧在車載系統的人機交互場景和發展在不斷進階。最早,主要做控制類型語音交互,比如開窗、關窗、打開空調和座椅調節等,再慢慢加入內容交互,比如音樂檢索等。在這種情況下,交互語音內容開始迭代更新。接著,進入比較自然式的人機交互,不再只是命令控制。比如調節溫度,說“我覺得好熱”時,車就給一個建議調低空調溫度等?,F在,人機交互場景增加到“千人千面”。比如,在聽電臺時,在車機交互過程中,是不是有個性化定制需求,比如導航播報是不是可以定制成自己所喜歡的聲音等。
在張晴晴看來,與同行相比,愛數智慧的核心優勢是采用對話式AI。傳統非對話式AI主要是命令控制,比較機械式,需先把文本規劃設計好,然后朗讀錄制。朗讀式和對話式主要差異是,朗讀式文本是設定死的,所有錄音人和采集人是按照文本來,變化性很少。按照文本朗讀出來,自然性不夠強。而愛數智慧的對話式,盡可能保證說話人采用最自然的方式交流,更貼合真實的使用場景。“在對話式AI里,我們已經拓展到很多語種。伴隨著車企出海過程,我們可以提供相應的數據解決能力?!?/p>
在汽車人機交互領域,愛數智慧的技術已在智能座艙、線上線下智能客服等場景應用。比如,愛數智慧推出了“標準數據集”產品。張晴晴說:“我們發現,車企不管哪個車型,在做命令交互時有很多相似處,比如打開空調、調低溫度等,這些東西我們可以把它形成一個行業的標準數據集,定期擴充它,保證它的時效性。這樣,客戶可以直接采購這樣的數據集,而不是從零開始定制服務,以免耽誤時間。作為車企人機交互的底層數據集,可以很快地幫助客戶把基礎能力先搭建起來。為此,我們提出了數據行業的二八原則,即幫助車企解決底層80%的標準數據和20%的定制數據,以更好的性價比和更快的速度來幫助車企完成整個智能化模型構建工作。這是我們提供智能方案的整體邏輯?!?/p>
在車載交互領域,人機交互呈現出多模態發展趨勢,比如在智能座艙里就有應用。張晴晴說:“去年底,我們開始布局多模態數據處理系統。同時,由于音頻本身信息量很大,所以音頻在多模態演進過程中,整體音頻部分的需求量在不斷增加,只是在音頻外還伴隨著其他模態需要處理。今年我們推出多模態數據處理系統。這個系統在迭代過程中將加速音頻在多模態中的需求量。”
愛數智慧創始人兼CEO張晴晴在2021中國汽車論壇期間接受采訪
據了解,愛數智慧創立于2016年。而作為一位女性創業者,張晴晴為何選擇在人機交互領域創業?
“我已在人工智能領域學習和從業17年,做對話式AI,研究語音識別。我的博士研究方向就是人機交互,就是語音、語言對話式場景。我覺得語音交互方式是人類和機器交流的一個最自然的方式,這是我開始就選擇語音領域發展的重要原因?!睆埱缜缯f,“汽車行業需要人機交互。在人工智能領域,女性占比開始比傳統的IT領域多起來。重要原因是人工智能本質上是一個數據行業,因為所有算法要靠數據驅動,而對于數據的認知和拆解,女性的優勢開始顯現出來。女性對世界的感知度、敏感度可能高一些,女性思考得比較多,同時對數據要有耐心分析和拆解。另外,女性特有的心思細膩、換位思考等能力,不同于男性的理解方式,也對機器理解人提供了很大幫助。在音頻方面,可能更明顯?!?/p>
其實,張晴晴曾是中科院科研人員,主要研究方向是如何構建一個更好的AI模型,從而讓機器更好地理解人說的話。據張晴晴介紹,愛數智慧已經從10多人發展到150多人?!拔覀冎饕獮榭蛻籼峁┫鄳臄祿?,其中兩類企業是我們的重要客戶:一是車企。比如車企自己有一些AI研發解決方案,我們可以對接到他的研發部門,提供相應的咨詢和數據服務。二是屬于垂直在車企行業提供解決方案的算法或者解決方案的公司,我們為他提供相應的數據支持?!?/p>
在愛數智慧成長過程中,有一件事給張晴晴留下了深刻印記。公司剛成立一年時,即2017年,當時公司有50多位員工,因為公司那時條件有限,租不起高大上的辦公樓,就在北京大興區租了一個比較小的商住兩用房子辦公。剛好那時北京大興區發生了幾場大火,愛數智慧自然受到影響。張晴晴清楚地記得,當年11月27日,那是周日下午五點,消防隊在整頓消防隱患房屋時,通知其所在的辦公樓因消防不合規必須當晚立即搬走。
要在幾個小時內把50多人的辦公物品撤走并非易事,而且當時根本就不知道要搬到哪里去。張晴晴回憶說:“當時我的心情非常忐忑,因為我不知道怎么跟所有員工講我們需要立刻搬家這件事情。如果我是員工,聽到老板這么講,我也會覺得這家公司不太靠譜。當時我在微信群里把大家請回來,還不好意思地告訴大家發生了什么。但所有同事回到公司后,我跟他們講需要立刻搬家時,沒有一個人抱怨和遲疑,大家都積極配合和出謀劃策,有的員工甚至開自家車來幫公司搬家。大家齊心協力,一個晚上就把物品搬到了新辦公樓。所以我說,創業是團隊創造奇跡的過程?!?/p>
幸運的是,這并沒有影響愛數智慧當年的成功融資。當年,愛數智慧獲得了明勢資本的Pre-A輪投資。張晴晴說:“那時我們正在籌備A輪融資,投資人看到了我們整個過程,毅然決然地決定投資?!?018年,愛數智慧又獲得策源創投和梅花創投的A輪投資;2019年,獲得策源資本和杭州復琢的A+輪投資;2021年初,獲得凡創資本的數千萬元B輪融資。
談到與資本方打交道時,張晴晴的心得是,彼此要相互理解,并且雙方認可彼此價值。至于未來要把公司做成什么樣的問題,張晴晴說:“我覺得應該回歸到創業初心。我在AI領域已經歷練17年,希望AI智能化浪潮可以一直前行,這樣對整個行業甚至人類都有非常好的價值和作用?!?/p>
現在愛數智慧不僅獲得了投資人的認可,也獲得了不少行業客戶的肯定,目前已為近100家頂級客戶提供數據服務,并獲得了多家全球頂級客戶的一流供應商資質。在張晴晴看來,創業者要知道目標在哪里,并堅持下去,這樣未來無論成敗都是英雄。
今年6月《數據安全法》通過,9月開始施行。作為數據服務商,張晴晴說:“數據安全性是我們的立命之本,我們完全遵照數據安全法,并將不遺余力地投入和迭代優化。我們是數據服務行業里較早一批拿到ISO/IEC 27701:2019標準認證的企業。這是全球最新的個人隱私認證?!?/p>
在給車企客戶提供解決方案時,愛數智慧通常建議客戶80%采用標準數據集,20%使用定制服務,其中80%的標準數據集由愛數智慧自行進行相應的數據包裝處理和入庫。張晴晴說:“我們采用兩種方式來保證數據的安全性。在數據處理環節,對于個人信息,進行脫敏處理,讓企業在使用數據時沒有安全風險;在數據處理定制部分,我們使用我們的數據私有化系統,這對車企來說是一種比較安全的方式?!?/p>
顯然,數據越來越重要,但企業做數據服務需要懂數據的人才,比如懂音頻、懂視頻和懂文本等,并擁有提供相應解決方案的能力。張晴晴說:“我做了很長時間的AI研發,最后我選擇做數據,就是因為我覺得在AI行業需要有專業的數據公司為所有算法以及研發人員提供更好的數據解決能力。只有這樣,整個人工智能才有機會更好地向前發展。我希望愛數智慧能幫助人工智能更好地向前發展,并希望所有想向智能化轉型的車企能更好地向前發展。這是我的初心?!?/p>