應(yīng)用

技術(shù)

物聯(lián)網(wǎng)世界 >> 物聯(lián)網(wǎng)新聞 >> 物聯(lián)網(wǎng)熱點(diǎn)新聞
企業(yè)注冊(cè)個(gè)人注冊(cè)登錄

三維識(shí)別,如何重新定義智能世界?

2020-08-21 08:49 與非網(wǎng)

導(dǎo)讀:隨著 5G 和 AI 的快速迭代,機(jī)器視覺(jué)也進(jìn)入了高速發(fā)展的新階段。

機(jī)器視覺(jué)是指利用相機(jī)、攝像機(jī)等傳感器,配合機(jī)器視覺(jué)算法賦予智能設(shè)備人眼的功能,從而進(jìn)行物體的識(shí)別、檢測(cè)、測(cè)量等功能。簡(jiǎn)單說(shuō)來(lái),機(jī)器視覺(jué)就是用機(jī)器代替人眼來(lái)做測(cè)量和判斷。

機(jī)器視覺(jué)是在 20 世紀(jì) 50 年代從統(tǒng)計(jì)模式識(shí)別開(kāi)始的,當(dāng)時(shí)的工作主要集中在二維圖像分析和識(shí)別。如今,隨著 5G、AI 等技術(shù)的日益發(fā)展,為機(jī)器視覺(jué)的升級(jí)帶來(lái)可能,將加速信息顯示從二維向三維過(guò)渡。

三維機(jī)器視覺(jué)是在二維機(jī)器視覺(jué)的基礎(chǔ)上增加了物理空間的深度信息,更全面、更真實(shí)地記錄了物理世界。因此,業(yè)內(nèi)一致認(rèn)為三維機(jī)器視覺(jué)技術(shù)是機(jī)器視覺(jué)領(lǐng)域新的技術(shù)突破,也是機(jī)器視覺(jué)領(lǐng)域新的商業(yè)風(fēng)口。

目前,機(jī)器視覺(jué)是正在快速發(fā)展的一個(gè)領(lǐng)域,正處于不斷突破、走向成熟的階段。它的發(fā)展不僅將大大推動(dòng)智能系統(tǒng)的發(fā)展,提高生產(chǎn)效率和自動(dòng)化程度,也將拓寬計(jì)算機(jī)與各種智能機(jī)器的研究范圍和應(yīng)用領(lǐng)域。

3D 視覺(jué)如何取代 2D?

縱觀行業(yè)發(fā)展,2D 視覺(jué)雖為當(dāng)前主流,但隨著測(cè)量精度要求越來(lái)越高,被測(cè)物體條件越來(lái)越復(fù)雜,2D 系統(tǒng)的缺陷也愈發(fā)突出。目前市場(chǎng)上可見(jiàn)的 2D 識(shí)別,實(shí)質(zhì)上屬于軟件層面驗(yàn)證技術(shù),雖然能夠做檢測(cè),但是存在可靠性不高、局限性、安全性差等諸多缺陷。

相比之下,3D 視覺(jué)技術(shù)在精度、靈活性和速度方面都是 2D 無(wú)可比擬的。的盧深視創(chuàng)始人兼 CEO 戶磊向筆者說(shuō)道,3D 機(jī)器視覺(jué)能夠精準(zhǔn)識(shí)別視野內(nèi)空間每個(gè)點(diǎn)位的三維坐標(biāo)信息,通過(guò)算法復(fù)原智能獲取三維立體成像。不但可以提高測(cè)量和識(shí)別的效率,從三個(gè)維度獲取信息,更增加了信息的準(zhǔn)確性和可靠性。

從技術(shù)角度來(lái)看,普通的 2D 成像是用平面?zhèn)鞲衅鹘邮毡慌臄z物體反射或者發(fā)出的可見(jiàn)光,從而形成二維圖像。由于現(xiàn)實(shí)世界是三維世界,2D 成像存在物體特征信息損失的情況,這意味著 2D 成像并不支持與物體三維信息的測(cè)量。例如 3D 人臉識(shí)別、三維建模、人機(jī)交互、AR、智能安防等功能。

為了彌補(bǔ) 2D 人臉識(shí)別的不足,3D 人臉識(shí)別應(yīng)運(yùn)而生。3D 傳感技術(shù)實(shí)現(xiàn)了物體實(shí)時(shí)三維信息的采集,為后期的圖像分析提供了關(guān)鍵特征,智能設(shè)備能夠根據(jù) 3D 傳感復(fù)原現(xiàn)實(shí)三維世界,并實(shí)現(xiàn)后續(xù)的智能交互。

根據(jù) Yole 的數(shù)據(jù),2017-2023 年全球 3D 成像和傳感器市場(chǎng)規(guī)模的復(fù)合年均增長(zhǎng)率為 44%,預(yù)計(jì) 2023 年,3D 傳感市場(chǎng)規(guī)模將達(dá)到 184 億美元。

不難判斷,在此趨勢(shì)下,3D 機(jī)器視覺(jué)將面臨較快的增長(zhǎng)趨勢(shì),3D 視覺(jué)未來(lái)將逐步取代 2D 識(shí)別技術(shù),在許多“痛點(diǎn)型應(yīng)用場(chǎng)景”中大顯身手,發(fā)展成為主流視覺(jué)系統(tǒng)。

安全問(wèn)題凸顯

眾所周知,隨著人臉識(shí)別技術(shù)的深入,千萬(wàn)級(jí)人臉大庫(kù)的重要性日益顯現(xiàn)。采集建庫(kù)既是三維人臉識(shí)別應(yīng)用的基礎(chǔ),也是三維人臉識(shí)別技術(shù)落地的關(guān)鍵。

近日《2019 年中國(guó)刷臉支付技術(shù)應(yīng)用社會(huì)價(jià)值專(zhuān)題研究報(bào)告》顯示,2019 年成為刷臉支付的“新元年”,刷臉支付用戶將達(dá)到 1.18 億人,到 2022 年有望突破 7 億人,或取代掃碼成為主流支付方式?,F(xiàn)在人臉識(shí)別方式越來(lái)越為大眾所使用,但關(guān)于個(gè)人信息安全等問(wèn)題也隨之而來(lái)。

對(duì)此,戶磊表示,“人臉識(shí)別領(lǐng)域沒(méi)有絕對(duì)的安全,安全是與成本息息相關(guān)的。從商業(yè)層面考慮,安全更多是取決于安全成本與作偽成本之間的考量。”

安全性上,的盧深視也有布局。一方面其算法已通過(guò) BCTC 增強(qiáng)級(jí)認(rèn)證,滿足國(guó)家認(rèn)證金融支付增強(qiáng)級(jí)安全標(biāo)準(zhǔn),可實(shí)現(xiàn)高強(qiáng)度防作偽。

另一方面,的盧深視對(duì)于小群體應(yīng)用場(chǎng)景產(chǎn)品做了針對(duì)性的設(shè)計(jì),以其 3D-Face ID 一體化解決方案智能門(mén)鎖為例,內(nèi)嵌一顆 AIoT 專(zhuān)用芯片,人臉信息存儲(chǔ)以及人臉比對(duì)均在門(mén)鎖端完成。借助在金融支付行業(yè)內(nèi)的豐富終端安全經(jīng)驗(yàn),打造了一個(gè)安全、受信的安全比對(duì)環(huán)境,外界是無(wú)法通過(guò)任何物理手段或者其他暴力拆解手段來(lái)獲取模組內(nèi)的私密個(gè)人生物特征信息。

基于成熟落地經(jīng)驗(yàn),的盧深視把三維機(jī)器視覺(jué)技術(shù)從高端安防領(lǐng)域切入金融支付、智慧社區(qū)、消費(fèi)電子、商超零售、虛擬現(xiàn)實(shí)等垂直細(xì)分領(lǐng)域,要用成熟的三維全棧技術(shù)賦能百業(yè)千家。

目前市場(chǎng)上主流的3D 識(shí)別技術(shù)

近日,在 2020 全球人工智能產(chǎn)品應(yīng)用博覽會(huì)(AIExpo2020)的現(xiàn)場(chǎng),的盧深視向與非網(wǎng)全面展示了其三維視覺(jué)全棧技術(shù)解決方案。

戶磊介紹道,的盧深視深耕三維機(jī)器視覺(jué)領(lǐng)域近 5 年,是國(guó)內(nèi)唯一打通“真三維”全棧技術(shù)、并實(shí)現(xiàn)國(guó)家級(jí)項(xiàng)目落地應(yīng)用的公司。公司基于“云+端+芯”一體化戰(zhàn)略,布局產(chǎn)品矩陣,下鉆垂直行業(yè)應(yīng)用領(lǐng)域,實(shí)現(xiàn)垂直整合及系統(tǒng)優(yōu)化。公司可提供大規(guī)模普及的、交互距離內(nèi)高精度的三維視覺(jué)感知產(chǎn)品及方案,產(chǎn)品形態(tài)涵蓋 Edge AI 芯片、智能模組、通用產(chǎn)品和行業(yè)解決方案。

談到三維識(shí)別技術(shù)方案,目前市場(chǎng)上主流的有結(jié)構(gòu)光、ToF、雙目視覺(jué)等三種 3D 視覺(jué)技術(shù)。

3D 結(jié)構(gòu)光通過(guò)紅外光投射器,將具有一定結(jié)構(gòu)特征的光線投射到被拍攝物體上,再由專(zhuān)門(mén)的紅外攝像頭進(jìn)行采集。主要利用三角形相似的原理進(jìn)行計(jì)算,從而得出圖像上每個(gè)點(diǎn)的深度信息,最終得到三維數(shù)據(jù)。

ToF 是利用激光測(cè)距,照射光源一般采用方波脈沖調(diào)制,根據(jù)脈沖發(fā)射和接收的時(shí)間差來(lái)測(cè)算距離。

雙目立體視覺(jué)則是基于視差原理并由多幅圖像獲取物體三維幾何信息的方法。由雙攝像機(jī)從不同角度同時(shí)獲得被測(cè)物的兩幅數(shù)字圖像,并基于視差原理恢復(fù)出物體的三維幾何信息,從而得出圖像上每個(gè)點(diǎn)的深度信息、最終得到三維數(shù)據(jù)。

可以看到,三種 3D 視覺(jué)測(cè)量原理都有各自的優(yōu)缺點(diǎn)。

與非網(wǎng)制圖

就目前看來(lái),3D 結(jié)構(gòu)光是各大廠商普遍采用的技術(shù)。同樣以的盧深視為例,的盧深視推出了兩款基于 3D 結(jié)構(gòu)光技術(shù),針對(duì)安全需求高小型人臉庫(kù)場(chǎng)景推出的自研國(guó)產(chǎn) 3D CV 相機(jī):高精度 RGBD 相機(jī)(標(biāo)準(zhǔn)型)和 3D-Face ID 智能模組。

戶磊進(jìn)一步指出,公司自研的 3D CV 相機(jī)均已實(shí)現(xiàn)量產(chǎn),在 3 米范圍誤差小于 1mm,指標(biāo)超越國(guó)際 3D 相機(jī)巨頭,且量產(chǎn)良率超 99%,精度全球領(lǐng)先,具備獨(dú)家專(zhuān)利技術(shù),高度自主可控。

的盧深視 3D-Face ID 智能模組

其中,高精度 RGBD 相機(jī)可用于刷臉支付終端、銀行 ATM、無(wú)人貨柜、地鐵刷臉閘機(jī)、AR/VR、物品體積測(cè)量等場(chǎng)景;3D-Face ID 智能模組可用于家庭智能門(mén)鎖、智能保險(xiǎn)柜、酒店公寓智能鎖、智能門(mén)禁等場(chǎng)景。

此外,對(duì)于可靠性和精度要求較高的制造業(yè)等領(lǐng)域來(lái)看,戶磊表示,將幾種測(cè)量原理結(jié)合一起的 3D 視覺(jué)技術(shù)也是未來(lái)發(fā)展的一個(gè)方向。

趨勢(shì)之外,痛點(diǎn)仍在

產(chǎn)業(yè)鏈匹配不完善

相對(duì) 2D 成像而言,3D 傳感技術(shù)的優(yōu)勢(shì)還體現(xiàn)在可產(chǎn)生大量的三維數(shù)據(jù),這些數(shù)據(jù)未來(lái)可應(yīng)用于大數(shù)據(jù)等行業(yè),具有巨大的行業(yè)應(yīng)用價(jià)值。

但是數(shù)據(jù)本身的豐富度反過(guò)來(lái)也會(huì)影響數(shù)據(jù)質(zhì)量和精度,這也對(duì)傳感器和相機(jī)提出了較高要求。現(xiàn)階段 3D 視覺(jué)行業(yè)的核心難點(diǎn)集中在產(chǎn)業(yè)鏈匹配不完善。

據(jù)了解,現(xiàn)階段 3D 視覺(jué)行業(yè)的核心難點(diǎn)集中在產(chǎn)業(yè)鏈匹配不完善。和很多新興行業(yè)一樣,在 3D 視覺(jué)行業(yè)蓬勃發(fā)展的同時(shí),產(chǎn)業(yè)鏈條體系混亂、產(chǎn)業(yè)關(guān)鍵鏈路無(wú)法閉環(huán)等問(wèn)題逐步凸顯,這些問(wèn)題成為制約行業(yè)發(fā)展的瓶頸。

三維視覺(jué)產(chǎn)業(yè)鏈涵蓋核心器件、模組裝配、像機(jī)成像系統(tǒng)設(shè)計(jì)、算法、感知技術(shù)方案與模塊、終端產(chǎn)品與行業(yè)方案多個(gè)環(huán)節(jié),由于三維機(jī)器視覺(jué)仍屬于較前沿的技術(shù),供應(yīng)鏈匹配上存在技術(shù)難度高、標(biāo)準(zhǔn)不統(tǒng)一等諸多問(wèn)題,整合產(chǎn)業(yè)鏈?zhǔn)?3D 視覺(jué)產(chǎn)業(yè)化應(yīng)用的必要路徑。

在產(chǎn)業(yè)鏈環(huán)節(jié),的盧深視定位為三維視覺(jué)感知系統(tǒng)技術(shù)方案提供商,上游承接相機(jī)模組裝配,通過(guò)團(tuán)隊(duì)研發(fā)的相機(jī)的系統(tǒng)設(shè)計(jì)和內(nèi)部算法形成 3D 感知技術(shù)模組、3D 通用產(chǎn)品、Edge AI 芯片以及行業(yè)解決方案,對(duì)于安防行業(yè)主要提供通用的終端產(chǎn)品,對(duì)于其它行業(yè)提供相關(guān)智能模組,并由下游的集成商合作伙伴將最終產(chǎn)品供給消費(fèi)者。

從行業(yè)整體來(lái)看,在現(xiàn)階段,如何借著轟轟烈烈的 AI 和 5G 浪潮,為行業(yè)搭建起一個(gè)凝聚上下游資源、協(xié)同產(chǎn)業(yè)鏈創(chuàng)新發(fā)展的平臺(tái)成為迫在眉睫的事情。

硬件價(jià)格和系統(tǒng)成本

傳統(tǒng)的機(jī)器視覺(jué)穩(wěn)定發(fā)展多年,目前處于硬件和軟件的發(fā)展基本匹配的階段。但是隨著檢測(cè)需求以及對(duì)安全性及可靠性等要求的提高,未來(lái)將用到深度學(xué)習(xí)來(lái)完成功能賦能,現(xiàn)在基礎(chǔ)的硬件需要做到領(lǐng)先于軟件一代。

因此,成本高又成為了當(dāng)前產(chǎn)業(yè)痛點(diǎn)之一。有行業(yè)資深人士表示,從硬件價(jià)格和系統(tǒng)成本來(lái)看,要突破傳統(tǒng)上所謂二年投入回報(bào)周期這一困局。兩年回收成本已經(jīng)無(wú)法撬動(dòng)行業(yè)需求,一年左右的時(shí)間周期才會(huì)帶動(dòng)中小企業(yè)愿意買(mǎi)單。

技術(shù)價(jià)值最大化的關(guān)鍵在于逐漸形成大規(guī)模的普及應(yīng)用,通過(guò)大面積提升行業(yè)的生產(chǎn)力水平和經(jīng)濟(jì)效益獲得,通過(guò)給客戶帶來(lái)價(jià)值而盈利,這是一個(gè)較為艱難的過(guò)程,但也是一個(gè)需要慢慢推進(jìn)的必要過(guò)程。

從機(jī)器視覺(jué)發(fā)展的客觀現(xiàn)狀來(lái)講,其實(shí)并不缺市場(chǎng)需求,但是缺少能夠真正落地的、真正發(fā)揮出經(jīng)濟(jì)效益的好產(chǎn)品。那么,應(yīng)該如何打破這個(gè)“緊箍咒”?推動(dòng)更多的落地應(yīng)用?

解決核心零部件的性?xún)r(jià)比,做到系統(tǒng)成熟穩(wěn)定可靠,是迫在眉睫的事情。只要將性?xún)r(jià)比做到極致,就能滿足目前工業(yè)機(jī)器視覺(jué)中絕大多數(shù)的應(yīng)用需求。另一方面,也體現(xiàn)在產(chǎn)品的適用性、標(biāo)準(zhǔn)化程度上。需要對(duì)視覺(jué)應(yīng)用真正的剛性需求逐漸顯現(xiàn)出來(lái),進(jìn)而實(shí)現(xiàn)降本增效的效果。

寫(xiě)在最后

在國(guó)內(nèi)如火如荼的科技發(fā)展浪潮和國(guó)內(nèi)經(jīng)濟(jì)發(fā)展的時(shí)代大背景下,3D 視覺(jué)產(chǎn)業(yè)鏈的優(yōu)化和鏈路閉環(huán)正在加劇進(jìn)行,產(chǎn)業(yè)形態(tài)的完備也將釋放出巨大的集群紅利,為產(chǎn)業(yè)鏈各環(huán)節(jié)創(chuàng)造新的發(fā)展局面。

在用戶日常觸達(dá)較高的刷臉支付方面,中國(guó)企業(yè)表現(xiàn)不俗,產(chǎn)業(yè)圍繞 3D 視覺(jué)技術(shù)研究及應(yīng)用開(kāi)展合作,共同推進(jìn)金融領(lǐng)域科技創(chuàng)新,成為中國(guó)金融支付領(lǐng)域?qū)崿F(xiàn)彎道超車(chē)的關(guān)鍵。

從智能支付到智能門(mén)鎖,包括的盧深視在內(nèi)的行業(yè)企業(yè)在探索 3D 機(jī)器視覺(jué)應(yīng)用的更多新方向。的盧深視配合式三維人臉采集終端填補(bǔ)了國(guó)內(nèi)三維人臉數(shù)據(jù)采集設(shè)備的技術(shù)空白,為千萬(wàn)級(jí)大庫(kù)時(shí)代人臉識(shí)別技術(shù)及場(chǎng)景奠定了基礎(chǔ),標(biāo)志著的盧深視三維全棧閉環(huán)已然成熟,打通了從云端建庫(kù)、算法比對(duì)、模組方案到終端產(chǎn)品的全鏈條,真正實(shí)現(xiàn)了技術(shù)應(yīng)用的“最后一公里”。

如今,中國(guó)已突破 3D 人臉識(shí)別技術(shù)的壁壘,相信在不久的將來(lái),中國(guó) 3D 傳感技術(shù)定會(huì)再上一個(gè)臺(tái)階,為更多用戶及其行業(yè)帶來(lái)更安全、方便、快捷的智慧生活體驗(yàn)。