應(yīng)用

技術(shù)

物聯(lián)網(wǎng)世界 >> 物聯(lián)網(wǎng)新聞 >> 物聯(lián)網(wǎng)熱點(diǎn)新聞
企業(yè)注冊(cè)個(gè)人注冊(cè)登錄

國(guó)內(nèi)外在語(yǔ)音識(shí)別方面優(yōu)勢(shì)和差距有多大?

2018-09-25 09:55 品途商業(yè)評(píng)論

導(dǎo)讀:人類認(rèn)識(shí)世界是通過(guò)把外界各種獨(dú)立的刺激聯(lián)系起來(lái)構(gòu)成一個(gè)整體,以獲得全面的信息和含義。語(yǔ)言是具有層次性的,在多重層面上按照詞法、句法、語(yǔ)義和語(yǔ)用原則,進(jìn)行字組詞、詞組短語(yǔ)和句子。人腦可以有效地處理并理解語(yǔ)言(語(yǔ)音),計(jì)算機(jī)語(yǔ)言(語(yǔ)音)信息處理沒(méi)有人類那樣有效

  人類認(rèn)識(shí)世界是通過(guò)把外界各種獨(dú)立的刺激聯(lián)系起來(lái)構(gòu)成一個(gè)整體,以獲得全面的信息和含義。語(yǔ)言是具有層次性的,在多重層面上按照詞法、句法、語(yǔ)義和語(yǔ)用原則,進(jìn)行字組詞、詞組短語(yǔ)和句子。人腦可以有效地處理并理解語(yǔ)言(語(yǔ)音),計(jì)算機(jī)語(yǔ)言(語(yǔ)音)信息處理沒(méi)有人類那樣有效。根據(jù)人腦理解語(yǔ)言過(guò)程的認(rèn)知機(jī)理,人類理解語(yǔ)言(語(yǔ)音)需要知識(shí)(包括世界知識(shí)、歷史知識(shí)、常識(shí)性知識(shí)、各學(xué)科門(mén)類的專業(yè)知識(shí)等)。

  在過(guò)去的幾十年里計(jì)算機(jī)自然語(yǔ)言處理幾乎都是用句法和語(yǔ)義信息進(jìn)行自然語(yǔ)言理解的,而語(yǔ)用知識(shí)是人類理解自然語(yǔ)言不可或缺的重要組成部分,缺少這部分語(yǔ)用信息使語(yǔ)言的理解能力大大受限,很多歧義的詞句和篇章只有在充分利用這些語(yǔ)用知識(shí)時(shí)才能有效地得到解決。要準(zhǔn)確理解自然語(yǔ)言,需要把句法分析和語(yǔ)義理解與具體語(yǔ)境的語(yǔ)用信息相結(jié)合。

  語(yǔ)用信息研究的瓶頸是如何用計(jì)算機(jī)將人類的各種知識(shí)進(jìn)行有效的特征提取和形式化的知識(shí)表達(dá),過(guò)去這一挑戰(zhàn)性工作一直困擾著我們,導(dǎo)致計(jì)算機(jī)無(wú)法像人腦一樣靈活運(yùn)用語(yǔ)用背景知識(shí)來(lái)解決自然語(yǔ)言中的各種歧義。

  隨著互聯(lián)網(wǎng)及云技術(shù)的飛速發(fā)展,給人類知識(shí)的形式化表征帶來(lái)了新的曙光。當(dāng)前谷歌、百度、中科院軟件所和清華大學(xué)等單位正在建立與人類知識(shí)相對(duì)應(yīng)的大規(guī)模知識(shí)圖譜,包括語(yǔ)言知識(shí)圖譜,事實(shí)性知識(shí)圖譜(Freebase已建立4000多萬(wàn)個(gè)實(shí)體,上萬(wàn)個(gè)屬性關(guān)系,24億多個(gè)事實(shí)三元組,百度百科的詞條數(shù)已1000萬(wàn)個(gè)),其目的就是建模人腦中的世界知識(shí),讓計(jì)算機(jī)能夠簡(jiǎn)潔快速地獲取新的信息和知識(shí),包括機(jī)讀的語(yǔ)用特征信息,運(yùn)用語(yǔ)用背景知識(shí)來(lái)解決語(yǔ)言理解中的各種歧義,由機(jī)器自動(dòng)理解語(yǔ)言的真實(shí)含義。

  知識(shí)圖譜可應(yīng)用于問(wèn)答系統(tǒng)、智能搜索引擎和自動(dòng)推理等。將可機(jī)讀的知識(shí)圖譜融入到語(yǔ)音識(shí)別中的語(yǔ)言模型之中,為語(yǔ)音理解提供消除歧義的各類知識(shí),相信會(huì)取得一些突破性的進(jìn)展。

  相比國(guó)外,國(guó)內(nèi)在人工智能語(yǔ)音識(shí)別方面差距不大,其原因是在當(dāng)前的互聯(lián)網(wǎng)和云計(jì)算時(shí)代,各種信息和資源共享給國(guó)內(nèi)外各研究單位提供了便利,加速了研發(fā)周期,在每年的AAAI,ACL,ICASSP等會(huì)議提供了理論和技術(shù)上交流,有些會(huì)議還定期提供語(yǔ)音識(shí)別、機(jī)器翻譯等系統(tǒng)評(píng)測(cè)平臺(tái)。

  中科院聲學(xué)所、自動(dòng)化所以及清華大學(xué)等單位比較突出的博士生在理論和技術(shù)水平上也接近歐美的水平,百度、亞洲微軟研究院等國(guó)內(nèi)高技術(shù)互聯(lián)網(wǎng)信息研究單位提供高薪為高技術(shù)人才提供了與國(guó)際接軌的研究平臺(tái)。相信AI和語(yǔ)音識(shí)別等領(lǐng)域的發(fā)展將會(huì)對(duì)社會(huì)的發(fā)展和人類生活的改善發(fā)揮越來(lái)越大的作用。