近日,清華大學(xué)集成電路學(xué)院教授任天令及合作團(tuán)隊(duì)在智能語音交互方面取得重要進(jìn)展,其研發(fā)的可穿戴人工喉可以感知喉部發(fā)聲相關(guān)信號,并通過人工智能模型將其識別和合成為語音。這一研究結(jié)果為語音識別與交互系統(tǒng)提供了一條新的技術(shù)途徑,并于日前在線發(fā)表在《自然·機(jī)器智能》上。
該研究團(tuán)隊(duì)通過激光直寫技術(shù)在超薄聚酰亞胺薄膜上轉(zhuǎn)化出基于石墨烯的智能可穿戴人工喉(AT),實(shí)現(xiàn)了對聲音信號和機(jī)械運(yùn)動的混合模態(tài)的感知,使AT能夠獲得低基頻信號,同時具有抗噪聲的語音感知能力。實(shí)驗(yàn)結(jié)果表明,混合模態(tài)AT能夠檢測基本語音元素(音素、聲調(diào)和單詞),平均準(zhǔn)確率達(dá)到99.05%。此外,通過集成AI模型,AT識別出了喉切除術(shù)患者含糊說出的日常詞匯,準(zhǔn)確率超過90%。