全球首個俄語AI合成主播亮相俄羅斯
近日,在第23屆圣彼得堡國際經濟論壇上,中國新華社、俄羅斯塔斯社和中國搜狗公司聯合推出了全球首個俄語AI合成主播。據了解,未來,它將被應用于塔斯社的新聞報道中。塔斯社是俄羅斯的國家通訊社,作為全球五大通訊社之一,對外向115個國家和地區提供新聞信息,在全球范圍都具有廣泛影響力。
據介紹,作為目前全球首個能真正實現AI真人影像模型構建的人工智能技術,“搜狗分身”誕生于搜狗“自然交互+知識計算”這一人工智能理念之下,是搜狗人工智能核心技術之一,同時也是AI合成主播的基礎。
它通過采集學習真人的聲音、嘴唇動作和表情,再結合聲音合成、表情合成、唇型合成等技術對AI進行擬人化訓練,便能克隆出與真人無異的AI分身,進而幫忙人類提高信息表達和傳遞的效率。
AI合成主播技術的迅速迭代、多語言語種的不斷豐富,都離不開“搜狗分身”技術的支持。隨著“搜狗分身”技術的發展,AI合成主播對數據采集的需求越來越小,目前可以在一天時間內采集完一個人所有的音頻和視頻素材,僅用幾個小時的視頻資料就可以形成一個逼真的形象。
此次由三方共同推進的全球首個俄語AI合成主播項目,將會良好地推進塔斯社在人機智能交互領域的建設,加快塔斯社在新聞播報領域的智能化進程。隨著其在俄羅斯日常新聞報道中的運用,搜狗AI合成主播概念將被更多大眾所認知,AI合成主播在國際上的影響力也將進一步得到擴大。
事實上這并不是搜狗第一次與世界頂級媒體的合作。早在2018年11月,搜狗就與新華社聯合推出了一中一英兩位AI合成主播。數據顯示,這兩位AI主播入職半年便已生產5100多條新聞報道,累計時長達13000多分鐘。
同時這也并非搜狗的第一次國際合作,今年3月,搜狗便獲得阿聯酋王室的熱切關注,與阿聯酋阿布扎比媒體集團達成了合作,雙方將共同打造全球首個阿語AI合成主播,通過多項人工智能技術幫助阿聯酋實現媒體智能化升級。
未來,結合搜狗以知識計算為基礎的對話和問答等核心能力,分身技術將被引入到更多行業的建設中,將能夠為娛樂、醫療、健康教育、法律、金融等多個領域的多種場景賦予更強大的功能,不斷實現各種“科幻到現實”的轉變。
亞馬遜CEO貝索斯試玩全球首款觸摸式遠程機器手
亞馬遜CEO杰夫·貝索斯(Jeff Bezos)在拉斯維加斯的亞馬遜機器人大會上控制了一對巨大的遙控機器人手(Dexterous Hand)。
這位全球首富用這雙機器人手疊杯子和彩虹環,把球從一只手傳給另一只手。在接過一個魔方后,貝索斯回答說:“不,謝謝,我甚至不能用我的手去做。”
貝索斯表示,反饋“很強烈”,使用它們感覺“不可思議的自然”。這雙機器手可以進行24個動作,并配有129個集成傳感器,可跟蹤位置、力度和壓力等因素。它可以舉起重達5公斤(11磅)的物品。
機器人是由Shadow Robot和HaptX共同設計。 Shadow Robot專門打造機器人手,并與特斯拉首席執行官Elon Musk共同創辦的AI研究機構OpenAI合作。 HaptX開發的技術為人們提供了遠程操作機器人以及VR的觸覺。
為了這個特殊的演示,雙手還配備了由南加州大學分拆公司SynTouch制造的BioTac觸覺傳感器。每個傳感器都包含柔軟、柔韌的皮膚和指紋狀的脊,覆蓋一個液體填充物。當皮膚在表面上移動時,由脊產生的振動通過液體產生共振,并通過內置的水聽器進行檢測。這允許傳感器識別紋理,并且還可以感知溫度。
配備BioTec的機器人手由戴著HaptX制造的一對觸覺反饋手套的用戶遠程控制。利用運動跟蹤技術,手套能夠感知佩戴者的手和手指的運動,并且它利用130個微流體觸覺傳感器通過選擇性地按壓皮膚來提供觸覺。在最近的測試中,加利福尼亞州的一名操作人員遠程操作了一個在倫敦的電腦鍵盤,通過手套上的指尖傳感器檢測到每一次擊鍵。以這種方式將觸摸和遠程操作結合起來是突破性的,并指出未來的應用,我們可以進行遠程操作,例如炸彈處理、深海工程,甚至是在不同的州執行的手術。
TensorFlow官宣新功能 攻克語言AI模型預處理偏差
谷歌發布TensorFlow優化新功能TF.Text庫,可對語言文本AI模型進行周期性預處理,大大節約了AI開發者對文本模型的訓練時間,簡化訓練流程。
TensorFlow幫助用戶利用圖像和視頻數據構建模型。但是,許多模型是以文本開頭的,從這些模型構建的語言模型需要進行一些預處理,才能將文本輸入到模型中。比如關于使用IMDB數據集的文本分類教程,就是從已經轉換為整數ID的文本數據開始入手的。
如果模型訓練和推理的時間不一樣,在訓練過程以外完成的預處理可能會和模型產生偏差,這就需要額外投入更多的時間和精力對預處理的過程進行協調。
TensorFlow本次推出的TF.Text就是為了解決這個問題,TF.Text是一個TensorFlow 2.0庫,可以使用PIP命令輕松安裝。它可以在基于文本的模型中定期執行這些預處理過程,并提供TensorFlow核心組件中并未提供的、關于語言建模的更多功能和操作。
其中最常見的功能就是文本的詞條化(tokenization)。詞條化是將字符串分解為token的過程。這些token可能是單詞、數字和標點符號,或是上述幾種元素的組合。TF.Text的Tokenizer使用RaggedTensors,這是一種用于識別文本的新型張量。
大疆發布首款教育機器人“機甲大師RoboMaster S1”
6 月 12 日,大疆發布首款教育機器人“機甲大師RoboMaster S1”,主打以硬核科技為基礎的機器人教育和機器人競技,將教育和娛樂的元素融入機器人產品中。
這個源自RoboMaster 機甲大師機器人比賽的消費級機器人,具備準工業級硬件,擁有性能充足的中央處理器、31 個傳感器、可模擬皮膚觸覺的感應裝甲、抖動控制精度在正負 0.02 度的云臺、全向移動的底盤。
這些配置讓RoboMaster S1 的大腦、感官和機體性能遠超同類的教育機器人產品,同時也是一款可玩性相當高、足夠酷炫的競技玩具。
RoboMaster S1 標準套裝售價為 3499 元,另有包括手柄在內的拓展包會在未來發售。該款機器支持設計自定義配件。
總的來說,RoboMaster S1 是目前消費級教育機器人領域技術集成度相當高的一款產品。它擁有性能優異的硬件和完備的基礎功能,是一臺真正的機器人,更重要的是它足夠好玩和酷炫,有足夠的吸引力驅動用戶去探索現實世界。在此基礎上,它擁有精心設置的視頻課程和項目教程,可以讓入門者保持探索學習的興趣,并具有足夠的可拓展空間,可以讓用戶盡情地搗鼓鉆研。RoboMaster S1 的出現將大大拉低人們接觸和擁有競技、教育機器人的門檻。