導讀:特斯拉無疑是業(yè)內(nèi)最大的「純視覺」擁護者。
在「自動駕駛汽車究竟應該用不用激光雷達」的問題上,車企已進行了長時間辯證,甚至衍生出了「激光雷達派」與「純計算機視覺派」。
而特斯拉無疑是業(yè)內(nèi)最大的「純視覺」擁護者了。
馬斯克對此的解釋有兩點:
1、激光雷達成本過高。
2、人類也是靠純視覺開車的。(2019年)
2021年7月,特斯拉給美國2000余名車主FSDBetaV9.0的體驗券,更新之后車子就可以在任意道路使用自動駕駛-——V9.0采用純純純視覺方案、甚至連毫米波雷達都不用。
若該版本FSD得以推行,或者將相關技術推及EAP(3.2w元的增強輔助駕駛),之后的Model 3、Y將省去毫米波硬件,進一步降本增利。據(jù)查詢,大陸(Continental)77GHz毫米波單機采購價在3000~4500元左右。
另外,盡管我們看到越來越多的激光雷達公司發(fā)布了千元車規(guī)級產(chǎn)品,但自動駕駛目前無一例外難逃成本問題。此前據(jù)媒體統(tǒng)計,例如谷歌、百度等自動駕駛團隊使用的64線激光雷達產(chǎn)品價格約為70萬人民幣,16線激光雷達約為5萬元。
在Model 3、Y系列量產(chǎn)車上,激光雷達更難以被采用,上千美元成本幾乎和當前的電池包價格相當。
馬斯克選擇的純視覺方案略微偏激,但成本控制上無人能及,眼下ModelY零售價27.6萬元,Model 3進一步降價似乎也不再遙遠。
當然,成本是說給資本家聽的,車主只關心到底安全不安全。
特斯拉的干爹——NHTSA(美國國家公路交通安全管理局)數(shù)據(jù)顯示,在美國,開674萬公里就會發(fā)生8.66次事故,而使用AutoPilot的特斯拉車主僅為1次,沒錢買Autopilot的發(fā)生事故2次,依然遠低于平均水平。
盡管中國道路遠遠復雜于美國,這個數(shù)據(jù)看起來對中國用戶參考意義不大,但足以說明特斯拉當前技術水平的地位。
那么,去除毫米波雷達的FSDBetaV9.0(下稱FSD 9)為何如此令人期待?
在一段FSD測試視頻中,特斯拉會暫時移除儀表兩側的應用,可視化界面將擴大以顯示周邊額外的信息,而駕駛速度、自動駕駛可用性、自動駕駛速度設置等信息被移到了儀表板的底部,這與當前只顯示三條車道的版本融入了更多視覺識別運算。
FSD 9之所以能夠取代毫米波的作用,原因有二:1、硬件升級,2、算法迭代。
首先,特斯拉自研FSD芯片終于發(fā)揮出了視覺算法的極限,相較于HW2.5,F(xiàn)SD電腦將算力提升至了144TOPS,每秒處理的圖片速度提升至2300幀。
按照官方說法,從2019年3月、4月起,特斯拉新下線的車型全部配備FSD芯片,所以國內(nèi)車型均有升級為「純視覺」的潛力。
算上此前版本,特斯拉芯片已經(jīng)經(jīng)過3次迭代,目前最新的FSD上搭載了特斯拉自主研發(fā)的兩枚芯片,也就是Autopilot3.0硬件,性能比2.5版本芯片強大21倍。
同時,截止2020年4月,特斯拉啟用Autopilot的行駛里程就已經(jīng)突破48億公里,如果用戶平均每天駕駛約一個小時(每輛車8個攝像頭),車隊每月大約會產(chǎn)生1.968 億個小時的視頻。
盡管所有數(shù)據(jù)中,只有1%“值得被標注”、有價值,但如此鮮活、真實規(guī)模國內(nèi)其他車企仍難以比擬。
為了處理巨量駕駛數(shù)據(jù),特斯拉將把針對自監(jiān)督學習技術的研發(fā)提高到絕對優(yōu)先級。特斯拉啟動了一個代號為Dojo 的重大項目,它是一臺超強的訓練計算機,處理的數(shù)據(jù)不再停留在圖片層面,而是針對視頻類的數(shù)據(jù),能夠以較低的成本實現(xiàn)算法性能的指數(shù)級提升。
筆者相信,F(xiàn)SD 9完成階段測試后,Dojo也將正式露面。
二、純視覺當前對手:傳感融合
在激光雷達普及前,純視覺需要贏掉「傳感融合」方案——攝像頭+毫米波雷達。
馬斯克曾在Twitter問:
當雷達和攝像頭有沖突,你相信誰?攝像頭更精準,所以你最好雙倍押注攝像頭而不是二者組合。
為了自我佐證,特斯拉搬出了多個極端案例:
1、避免「幽靈剎車」:在前車緊急制動的場景下,純視覺方案沒有出現(xiàn)Radar那種信息中斷和誤判的情況,非常線性,從而能夠提供線性的制動決策,帶來更佳的使用體驗。
2、避免「指橋為墻」:通過立交橋下的場景中,由于Radar的垂直分辨率很低,所以容易導致系統(tǒng)誤判空中的物體為障礙物;而純視覺方案則完全不會出現(xiàn)該問題。
3、做到「提前感知」:對于毫米波雷達來說,前方車輛??吭诼愤?,導致識別較晚,在距離車輛110米時才感知到前方停有卡車。而純視覺方案在距離車輛180米的時候就已經(jīng)識別了該車輛。
總之,這很符合馬斯克最初的理念:人類在開車的時候,也都是靠眼睛、查普通地圖,更不會依靠高精度地圖。