技術(shù)
導(dǎo)讀:地平線為小米小愛觸屏音箱量身打造的智能語音前端,采用地平線自主研發(fā)的ESE方案,僅用雙麥克風(fēng)即可在強(qiáng)噪聲干擾條件下有效抽取語音信號(hào)。
2月20日,搭載地平線自主研發(fā)的增強(qiáng)語音抽取(Enhanced Speech Extraction,ESE)方案的小米小愛觸屏音箱在京發(fā)布。小米小愛觸屏音箱是小米的首款帶屏智能音箱,在發(fā)布會(huì)One more thing的環(huán)節(jié)推出,是小米在AIoT領(lǐng)域的樞紐級(jí)產(chǎn)品。地平線為該產(chǎn)品提供了完整的設(shè)備端語音前端信號(hào)處理和喚醒解決方案,讓小愛觸屏音箱能聽見更能聽清。
地平線為小米小愛觸屏音箱量身打造的智能語音前端,采用地平線自主研發(fā)的ESE方案,僅用雙麥克風(fēng)即可在強(qiáng)噪聲干擾條件下有效抽取語音信號(hào)。測試結(jié)果表明,地平線ESE方案能夠顯著弱化家居生活場景中的常見噪聲,比如電視、廚房、洗衣機(jī)以及其他人聲的干擾,保證較高的喚醒率。
同時(shí),考慮到誤喚醒對用戶體驗(yàn)的影響,地平線還在前端針對喚醒做了深度算法優(yōu)化,保證了極低的誤喚醒率。據(jù)項(xiàng)目負(fù)責(zé)人介紹,在測試條件下,搭載地平線ESE方案的小愛觸屏音箱可實(shí)現(xiàn)在48小時(shí)連續(xù)測試中實(shí)現(xiàn)零次誤喚醒,遠(yuǎn)超業(yè)界普遍認(rèn)可的產(chǎn)品化標(biāo)準(zhǔn)。經(jīng)過算法優(yōu)化,搭載地平線ESE方案的小愛觸屏音箱可在復(fù)雜的噪聲環(huán)境中實(shí)現(xiàn)隨時(shí)打斷、隨時(shí)喚醒,打造流暢自然的人機(jī)交互體驗(yàn)。
小米小愛觸屏音箱
地平線創(chuàng)始人兼CEO余凱表示:“很高興地平線和小米首次開展合作。成立三年多以來,地平線致力于成為邊緣人工智能芯片和計(jì)算平臺(tái)的全球領(lǐng)導(dǎo)者,讓各種智能終端Horizon Inside,讓每個(gè)人的生活更安全,更美好。這次地平線和小米的重量級(jí)合作落地,標(biāo)志著地平線朝著這個(gè)方向又邁進(jìn)一步。未來,地平線將繼續(xù)發(fā)揮在語音與視覺等領(lǐng)域的技術(shù)優(yōu)勢,深耕邊緣人工智能,將軟件與芯片硬件深度融合,探索開發(fā)出性能更加強(qiáng)悍的AI芯片,以及更多軟硬結(jié)合的邊緣計(jì)算產(chǎn)品?!?/p>
地平線在語音領(lǐng)域能夠提供包含前端信號(hào)處理、喚醒、語音識(shí)別、語義理解以及語音合成的全鏈路解決方案。方案采用最新的深度學(xué)習(xí)算法,通過有效的“端”“云”結(jié)合,能夠更好地解決復(fù)雜場景下的語音識(shí)別問題。除智能家居外,在車載領(lǐng)域,地平線亦可以提供全車音頻解決方案,包括車載降噪、識(shí)別、多模交互、分區(qū)拾音、分區(qū)播放以及車內(nèi)增強(qiáng)通信等。
地平線一直踐行的“算法+芯片”的軟硬結(jié)合策略同樣體現(xiàn)在語音交互領(lǐng)域。地平線語音交互產(chǎn)品從研發(fā)之初就在算法層面考慮到芯片化的需求。目前語音算法在內(nèi)存和計(jì)算效率都面向芯片實(shí)現(xiàn)了針對性優(yōu)化,以滿足低功耗、低成本、易集成等要求,并且在地平線第一代人工智能芯片上進(jìn)行了算法驗(yàn)證。
人工智能時(shí)代,多模交互可以更好地提升用戶體驗(yàn),而地平線擁有業(yè)界頂尖的語音和圖像算法團(tuán)隊(duì)。小米小愛音箱在小米生態(tài)中有著重要的戰(zhàn)略地位。本次牽手小米,也標(biāo)志著地平線智能語音技術(shù)在國內(nèi)市場實(shí)現(xiàn)重量級(jí)合作落地。
在AI技術(shù)廣泛應(yīng)用的圖像和語音處理領(lǐng)域,端云結(jié)合已成為必然趨勢。未來,地平線將在語音和圖像深度融合上進(jìn)一步發(fā)力,開發(fā)功能更加強(qiáng)大的AI芯片及產(chǎn)品,助力客戶打造更完美的智能化終端,為智能設(shè)備用戶提供更加舒適人性化的交互體驗(yàn)。