導讀:隨著人工智能的發(fā)展,語音識別技術(shù)迎來了新的突破,智能程度不斷提升、應(yīng)用范圍愈發(fā)廣泛,市場前景備受看好。不過,口音和方言依然是語音識別普及之路上的“攔路虎”,不得不“除”。
隨著人工智能的發(fā)展,語音識別技術(shù)迎來了新的突破,智能程度不斷提升、應(yīng)用范圍愈發(fā)廣泛,市場前景備受看好。不過,口音和方言依然是語音識別普及之路上的“攔路虎”,不得不“除”。
說句話就能控制所有電器開關(guān)、聽音樂只需報出歌名……一直以來,人類都懷揣著與其他生物乃至機器進行語音交流的夢想,而現(xiàn)在,人工智能的飛速發(fā)展,正推動這一想象變?yōu)楝F(xiàn)實。如今,語音識別技術(shù)的廣泛應(yīng)用,讓智能語音產(chǎn)品逐漸風靡全球。
語音識別發(fā)展突飛猛進
近年來,生物識別領(lǐng)域日趨升溫,語音識別技術(shù)取得顯著進步,開始加速從實驗室走向消費市場。眼下,語音助手、客服機器人、智能音箱等應(yīng)用都用到了語音識別技術(shù),家電、工業(yè)、金融、汽車電子等行業(yè)成為主要商業(yè)化場景。
在國內(nèi),語音識別技術(shù)的研發(fā)始于上世紀50年代,但是由于各方面條件限制,發(fā)展一直十分緩慢。到了80年代以后,隨著計算機等技術(shù)的發(fā)展與普及,國內(nèi)外語音識別技術(shù)的研究都迎來了一股新熱潮。
進入新世紀,借助深度學習技術(shù)突破帶動的人工智能領(lǐng)域崛起,以及大數(shù)據(jù)等信息技術(shù)的進步,包括語音識別在內(nèi)的生物識別技術(shù)取得了突飛猛進的發(fā)展。不少科技公司、互聯(lián)網(wǎng)企業(yè)都將語音識別視為進軍人工智能的橋頭堡,進一步促進了語音識別市場的巨大擴張。
當前,國外語音識別技術(shù)發(fā)展以蘋果、亞馬遜等企業(yè)為尊;而在國內(nèi),科大訊飛、BAT三巨頭、搜狗、盛大等公司也在積極布局語音識別技術(shù),并研發(fā)、上市了一批相關(guān)產(chǎn)品。在這些公司以及資本市場的推動下,語音識別技術(shù)已然成為最為火熱的科技應(yīng)用之一。
語音識別技術(shù)有得有失
在生物識別領(lǐng)域中,語音識別技術(shù)是應(yīng)用最為成熟、使用最為便捷、商業(yè)化程度最高的一個細分領(lǐng)域之一。而語音識別技術(shù)之所以受到各大科技企業(yè)的關(guān)注和資本市場的青睞,就在于其所具有的一系列優(yōu)勢:
一是語音采集較為方便,無需繁復配合、也幾乎不用動手,因而能夠吸引更多的消費者;二是語音識別技術(shù)應(yīng)用成本較低,一般只需一個麥克風配合系統(tǒng)軟件,語音分析、辨別的算法復雜程度也較低;三是更符合消費者的期待與需求,較為適合智能家居等新興業(yè)態(tài)的發(fā)展趨勢。
當然,語音識別技術(shù)固然優(yōu)勢多多,但是在當前階段依然存在著一些缺點,例如:每個人的聲音并不是一成不變,而是會隨著年齡的變化而變化;周邊的環(huán)境噪音對于語音的采集有一定干擾,距離因素也是采集過程中不能忽視的問題;另外,還有語音識別準確率及理解能力有待提升等不足都亟需予以重視,并逐步進行完善。
口音或方言是最大挑戰(zhàn)
無論是在國內(nèi)還是國外,方言或是口音都是切實存在的,而這對于語音識別技術(shù)的應(yīng)用和普及來說,無疑是最大挑戰(zhàn)。因為從經(jīng)濟效益、商業(yè)化推廣等方面考慮,企業(yè)在研發(fā)階段,一般都是采用所在國最為主流的語言形式,但是在實際應(yīng)用時,消費者的語言習慣卻并不一定符合預(yù)期設(shè)定。
一旦用戶有嚴重的口音,或是使用的方言不在識別范圍內(nèi),那么就會導致語音識別系統(tǒng)反應(yīng)遲鈍、識別率降低,甚至完全無法識別,最終影響消費者的使用體驗,從而造成市場口碑受到質(zhì)疑。很顯然,如果不能解決這一挑戰(zhàn),語音識別的普及就將被限定在目前的瓶頸之中。
因此,針對口音和方言展開的新一輪語音識別技術(shù)研發(fā),或?qū)⒊蔀樾碌母偁幗裹c??梢灶A(yù)見,隨著識別語種的愈發(fā)豐富及準確率進一步提升,語音識別技術(shù)的普及程度將會再度提高,相關(guān)的產(chǎn)品將更為公眾所接受,語音識別市場的爆發(fā)也就可期了。