国产亚洲精品网站_日本77777_在线观看av日韩_天天综合天天添夜夜添狠狠添_成年在线观看视频_欧美大片久久久_国产乱码一区二区三区四区_欧洲在线免费视频_欧美日韩第二页_韩国黄色一级大片_色婷婷综合在线观看_av网站大全免费

首頁 > 科技知識(shí) > 科技知識(shí) > 解讀毫末技術(shù)論文Cam4DOcc:僅使用攝像頭可實(shí)現(xiàn)4D占據(jù)預(yù)測(cè)?

解讀毫末技術(shù)論文Cam4DOcc:僅使用攝像頭可實(shí)現(xiàn)4D占據(jù)預(yù)測(cè)?

發(fā)布時(shí)間:2024-04-08 21:11:01來源: 152102

為了確保自動(dòng)駕駛汽車在行駛中能夠安全、可靠地執(zhí)行任務(wù),了解周圍環(huán)境的變化至關(guān)重要。近年來,一些技術(shù)能夠通過分析攝像機(jī)圖像來估計(jì)周圍物體的位置和分布,這對(duì)于理解大規(guī)模場(chǎng)景的結(jié)構(gòu)非常有幫助。

然而,這些技術(shù)主要關(guān)注的是當(dāng)前的3D空間,對(duì)于未來物體可能的位置和狀態(tài)并沒有太多考慮。

為了解決這個(gè)問題,最近,毫末智行聯(lián)合上海交大、國防科大、北京理工大學(xué)提出了一種新的方法,叫做Cam4DOcc。

這是一個(gè)專門為僅使用攝像頭進(jìn)行4D占用預(yù)測(cè)而設(shè)計(jì)的基準(zhǔn)測(cè)試,用于評(píng)估未來一段時(shí)間內(nèi)周圍場(chǎng)景的變化。

Cam4DOcc基準(zhǔn)測(cè)試的目標(biāo)是使用攝像頭圖像作為輸入,預(yù)測(cè)當(dāng)前和未來短時(shí)間內(nèi)(通常是幾秒內(nèi))的3D空間占用狀態(tài)。

包括對(duì)一般可移動(dòng)物體(GMO)和一般靜態(tài)物體(GSO)的占用狀態(tài)進(jìn)行預(yù)測(cè)。預(yù)測(cè)任務(wù)又分為多個(gè)級(jí)別,從預(yù)測(cè)膨脹的GMO到預(yù)測(cè)精細(xì)的GMO、GSO和自由空間。

Cam4DOcc基準(zhǔn)測(cè)試為自動(dòng)駕駛中的4D占用預(yù)測(cè)提供了一個(gè)標(biāo)準(zhǔn)化的評(píng)估平臺(tái),使研究人員能夠比較不同算法的性能。通過這些測(cè)試,研究人員可以更好地理解和改進(jìn)自動(dòng)駕駛系統(tǒng)在理解和預(yù)測(cè)周圍環(huán)境方面的能力。

毫末預(yù)測(cè),自動(dòng)駕駛領(lǐng)域中下一個(gè)重要的挑戰(zhàn)將是僅使用攝像頭進(jìn)行4D占據(jù)預(yù)測(cè)。這項(xiàng)技術(shù)不僅可以通過攝像頭圖像擴(kuò)展時(shí)間上的占據(jù)預(yù)測(cè),還要在BEV格式和預(yù)定義類別之外拓展語義/實(shí)例預(yù)測(cè)。

該論文的主要核心貢獻(xiàn)包括:

提出了Cam4DOcc基準(zhǔn),這是第一個(gè)促進(jìn)基于攝像頭的4D占用預(yù)測(cè)未來工作的基準(zhǔn)。

通過利用現(xiàn)有數(shù)據(jù)集,提出了自動(dòng)駕駛場(chǎng)景中預(yù)測(cè)任務(wù)的新數(shù)據(jù)集格式。

提供了四種新穎的基于攝像頭的4D占用預(yù)測(cè)基線方法,其中三種是現(xiàn)成方法的擴(kuò)展。

還引入了一個(gè)新穎的端到端4D占用預(yù)測(cè)網(wǎng)絡(luò),展示了強(qiáng)大的性能,為研究者提供了有價(jià)值的參考。

論文引入了標(biāo)準(zhǔn)化評(píng)估協(xié)議,并通過Cam4DOcc基于該協(xié)議進(jìn)行了全面的實(shí)驗(yàn)和詳細(xì)的分析。

下面我們來詳細(xì)剖析這篇論文。

01.

解鎖自動(dòng)駕駛時(shí)空預(yù)測(cè)的超能力

該論文首先提出了一個(gè)新的數(shù)據(jù)集格式。

該格式基于現(xiàn)有的數(shù)據(jù)集(包括nuScenes、nuScenes-Occupancy和Lyft-Level5)進(jìn)行了擴(kuò)展和調(diào)整,這樣就可以適應(yīng)4D占用預(yù)測(cè)的需求,這里需求就包括關(guān)于可移動(dòng)和靜態(tài)物體的連續(xù)占用狀態(tài),以及它們的3D向后向心流的信息。

下圖為以原始和Scenes-Occupancy為基礎(chǔ),在Cam4DOcc中構(gòu)建數(shù)據(jù)集的整體流程。

通過利用現(xiàn)有數(shù)據(jù)集,提出了自動(dòng)駕駛場(chǎng)景中預(yù)測(cè)任務(wù)的新數(shù)據(jù)集格式被重組為一種新穎的格式,既考慮了一般的活動(dòng)類別,也考慮了靜態(tài)類別,用于統(tǒng)一的四維空間占用預(yù)測(cè)任務(wù)。

如下圖所示,論文首先將原始nuScenesnu分割成時(shí)間長度為N = Np+Nf+1的序列。然后按順序?qū)梢茢?shù)據(jù)集動(dòng)物體進(jìn)行語義和實(shí)例注釋,并收集到 GMO 中。

包括自行車、公共汽車、汽車、建筑、摩托車、拖車、卡車和行人,它們都被轉(zhuǎn)換為當(dāng)前坐標(biāo)系(t = 0)。

之后,再對(duì)當(dāng)前3D空間進(jìn)行體素化,并使用邊界框注釋語義/實(shí)際標(biāo)簽附加到可移動(dòng)對(duì)象的網(wǎng)格。

值得注意的是,在此過程中,一旦出現(xiàn)以下情況,無效實(shí)例就會(huì)被丟棄。

(1)如果它是 Np 個(gè)歷史幀中新出現(xiàn)的對(duì)象,則其可見性在 6 個(gè)攝像機(jī)圖像中低于 40%

(2)它首先出現(xiàn)在 Nf 個(gè)傳入幀中或者

(3)它超出了在 t = 0 時(shí)預(yù)定義的范圍(H,W,L)。可見性通過相機(jī)圖像中顯示的實(shí)例的所有像素的可見比例來量化[29]。基于恒定速度假設(shè)[22]、[44],利用順序注釋來填充缺失的中間實(shí)例。相同的操作也適用于 Lyft-Level5 數(shù)據(jù)集。

最后,論文作者利用Lyft-Level5數(shù)據(jù)集生成3D中的實(shí)例關(guān)聯(lián)生成三維向心流。利用此3D流來提高基于攝像頭的4D 占用預(yù)測(cè)的準(zhǔn)確性。

該論文的目標(biāo)不僅是預(yù)測(cè)GMO的未來位置,還要估計(jì)GSO的占用狀態(tài)和安全導(dǎo)航所需的自由空間。因此,作者們又進(jìn)一步將原始nuScenes中的順序?qū)嵗⑨屌c從nuScenes-Occupancy轉(zhuǎn)換到當(dāng)前幀的順序占用注釋連接起來。這種組合平衡了自動(dòng)駕駛應(yīng)用中下游導(dǎo)航的安全性和精度。GMO標(biāo)簽借鑒了原始nuScenes的邊界框標(biāo)注,可以看作是對(duì)可移動(dòng)障礙物進(jìn)行了膨脹操作。GSO 和免費(fèi)標(biāo)簽由nuScenes-Occupancy提供,專注于周圍大型環(huán)境的更細(xì)粒度的幾何結(jié)構(gòu)。

介紹完數(shù)據(jù)集,接下來是評(píng)估協(xié)議。為了充分發(fā)揮僅使用攝像頭的 4D 占用預(yù)測(cè)性能,作者在 Cam4DOcc 中建立了具有不同復(fù)雜程度的各種評(píng)估任務(wù)和指標(biāo)。

論文在標(biāo)準(zhǔn)化評(píng)估協(xié)議中引入了四級(jí)占用預(yù)測(cè)任務(wù):

(1)預(yù)測(cè)膨脹的GMO:所有占用網(wǎng)格的類別分為GMO和其他,其中來自nuScenes和LyftLevel5的實(shí)例邊界框內(nèi)的體素網(wǎng)格被注釋作為GMO。

(2)預(yù)測(cè)細(xì)粒度GMO:類別也分為GMO和其他,但GMO的注釋直接來自nuScenes-Occupancy的體素標(biāo)簽,去除了第2節(jié)中介紹的無效網(wǎng)格。

(3)預(yù)測(cè)膨脹的GMO、細(xì)粒度GSO和自由空間:類別分為來自邊界框注釋的GMO、遵循細(xì)粒度注釋的GSO和自由空間。

(4)預(yù)測(cè)細(xì)粒度GMO、細(xì)粒度GSO和自由空間:類別分為GMO和GSO,均遵循細(xì)粒度注釋,和自由空間。由于 Lyft-Level5 數(shù)據(jù)集缺少占用標(biāo)簽,因此作者僅對(duì)其第一個(gè)任務(wù)進(jìn)行指標(biāo)評(píng)估。對(duì)于所有四個(gè)任務(wù),作者使用交并集(IoU)作為性能指標(biāo)。作者分別評(píng)估當(dāng)前時(shí)刻 (t = 0) 占用率估計(jì)和未來時(shí)間 (t ∈ [1, Nf ]) 預(yù)測(cè):

其中St'和St分別表示時(shí)間戳t處的估計(jì)體素狀態(tài)和真實(shí)體素狀態(tài),更接近當(dāng)前時(shí)刻的時(shí)間戳的IoU對(duì)最終的IoUf貢獻(xiàn)更大。這符合“接近時(shí)間戳的占用預(yù)測(cè)對(duì)于后續(xù)運(yùn)動(dòng)規(guī)劃和決策更為重要”的yuan。

接下來,論文作者們又提出了四種基線。

為了建立一個(gè)全面比較的基準(zhǔn),基于攝像頭的感知和預(yù)測(cè)功能,論文引入了四種不同類型的基線方法。

這些方法包括靜態(tài)世界占用模型、點(diǎn)云預(yù)測(cè)的體素化、基于2D-3D實(shí)例的預(yù)測(cè)。這些基線方法為論文提供了一個(gè)框架,以便可以比較和評(píng)估各種方法在當(dāng)前和未來占用估計(jì)方面的性能。

靜態(tài)世界占用模型可以理解為一種假設(shè)環(huán)境在短時(shí)間內(nèi)保持不變的簡(jiǎn)單方法。在這種假設(shè)下,當(dāng)前估計(jì)的占用網(wǎng)格可以作為所有未來時(shí)間步的預(yù)測(cè)。這種方法僅基于靜態(tài)世界假設(shè),即在預(yù)測(cè)的時(shí)間范圍內(nèi),場(chǎng)景中的物體不會(huì)發(fā)生顯著的運(yùn)動(dòng)變化。(如下圖)

點(diǎn)云預(yù)測(cè)的體素化是指將點(diǎn)云預(yù)測(cè)的結(jié)果轉(zhuǎn)換為體素(voxel)表示的一種方法。

一般這個(gè)過程涉及幾個(gè)步驟:

深度估計(jì):首先,使用環(huán)視攝像頭捕獲的圖像,通過深度估計(jì)算法生成連續(xù)的周圍視圖深度圖。

點(diǎn)云生成:接著,通過射線投射(ray casting)技術(shù),將深度圖轉(zhuǎn)換為3D點(diǎn)云。這個(gè)過程模擬了激光雷達(dá)(LiDAR)的工作原理,通過多個(gè)攝像頭的深度信息來重建三維空間中的點(diǎn)。

點(diǎn)云預(yù)測(cè):使用現(xiàn)有的點(diǎn)云預(yù)測(cè)方法(如PCPNet)來預(yù)測(cè)未來時(shí)間步的3D點(diǎn)云。這些方法通常基于當(dāng)前的點(diǎn)云數(shù)據(jù),通過學(xué)習(xí)點(diǎn)云隨時(shí)間變化的模式來預(yù)測(cè)未來的點(diǎn)云。

語義分割:預(yù)測(cè)得到的點(diǎn)云通過語義分割算法(如Cylinder3D)進(jìn)行處理,以提取可移動(dòng)和靜態(tài)物體的點(diǎn)級(jí)標(biāo)簽。

體素化:最后,將預(yù)測(cè)得到的點(diǎn)云轉(zhuǎn)換為體素表示,即將每個(gè)點(diǎn)映射到一個(gè)三維網(wǎng)格中,形成占用網(wǎng)格(occupancy grid)。這樣,每個(gè)體素代表一個(gè)空間體積,其值表示該空間是否被物體占據(jù)。

這種方法的關(guān)鍵作用在于,它能夠?qū)Ⅻc(diǎn)云預(yù)測(cè)的結(jié)果轉(zhuǎn)換為一種適合于占用預(yù)測(cè)的格式,即體素化表示。通過這種方式,可以更好地評(píng)估和比較不同預(yù)測(cè)方法在自動(dòng)駕駛場(chǎng)景中對(duì)動(dòng)態(tài)和靜態(tài)物體未來狀態(tài)的預(yù)測(cè)能力。

基于2D-3D實(shí)例的預(yù)測(cè)指的是一種基于實(shí)例的預(yù)測(cè)方法,它使用環(huán)繞視圖攝像頭來預(yù)測(cè)近未來的語義場(chǎng)景,包括車輛、行人等動(dòng)態(tài)物體的位置和運(yùn)動(dòng)。這種方法是作為Cam4DOcc基準(zhǔn)中的一個(gè)基線提出的,用于評(píng)估和比較不同的4D占用預(yù)測(cè)方法。

當(dāng)然,在智駕網(wǎng)看來,基于2D-3D實(shí)例的預(yù)測(cè)方法也有一定局限性。

這個(gè)方法涉及到2D實(shí)例預(yù)測(cè)的步驟,2D實(shí)例預(yù)測(cè)是指使用2D鳥瞰圖(BEV)格式的實(shí)例預(yù)測(cè)算法(如PowerBEV)來預(yù)測(cè)動(dòng)態(tài)物體在未來時(shí)間步的語義分布。這些算法直接從多視圖2D攝像頭圖像中提取BEV特征,并結(jié)合時(shí)間信息來估計(jì)未來的實(shí)例分布。

局限就在于它依賴于2D BEV格式的預(yù)測(cè),并且假設(shè)所有動(dòng)態(tài)物體在同一高度上運(yùn)動(dòng),這可能不適用于所有場(chǎng)景,特別是在復(fù)雜的城市環(huán)境中。

上述三種基線在執(zhí)行任務(wù)過程中都存在局限性,因?yàn)椴荒苤苯宇A(yù)測(cè)未來三維空間的占用狀態(tài),它們需要額外的后處理——根據(jù)現(xiàn)有結(jié)果擴(kuò)展和轉(zhuǎn)化為四維空間占用預(yù)測(cè)。

因此,論文也提出了端到端的4D占用預(yù)測(cè)網(wǎng)絡(luò)OCFNet。

02.

OCFNet:端到端4D占用預(yù)測(cè)的創(chuàng)新

OCFNet能夠直接從攝像頭圖像中預(yù)測(cè)3D空間的未來占用狀態(tài),而不需要依賴于2D到3D的轉(zhuǎn)換。

OCFNet通過接收連續(xù)的環(huán)繞視圖攝像頭圖像,能夠同時(shí)預(yù)測(cè)當(dāng)前占用狀態(tài)和未來占用變化。該網(wǎng)絡(luò)利用多幀特征聚合模塊和未來狀態(tài)預(yù)測(cè)模塊,不僅預(yù)測(cè)了物體的占用狀態(tài),還預(yù)測(cè)了物體的運(yùn)動(dòng)流,為自動(dòng)駕駛車輛提供了更為豐富和精確的信息。

最后論文結(jié)果分析,OCFNet的性能在多個(gè)任務(wù)上超過了第一段分析的三個(gè)基線方法(靜態(tài)世界占用模型、點(diǎn)云預(yù)測(cè)的體素化、2D-3D實(shí)例基礎(chǔ)預(yù)測(cè))。

比如下圖中的實(shí)驗(yàn)任務(wù)是預(yù)測(cè)nuScenes和LyftLevel5上的GMO。這里OpenOccupancy-C、PowerBEV和OCFNet僅使用膨脹的GMO標(biāo)簽進(jìn)行訓(xùn)練,而PCPNet則通過整體點(diǎn)云進(jìn)行訓(xùn)練。OCFNet和OCFNet†優(yōu)于所有其他基線,在 nuScenes上的IoUf和IoUf'上超過基于BEV的方法12.4%和13.3%。在Lyft-Level5上,作者的OCFNet和OCFNet†在 IoUf和IoUf'方面始終優(yōu)于PowerBEV-3D 20.8%和21.8%。

下圖顯示了OCFNet和CFNet†對(duì)nuScenes GMO占用率進(jìn)行預(yù)測(cè)的結(jié)果,這表明僅使用有限數(shù)據(jù)訓(xùn)練的OCFNet仍然可以合理地捕獲GMO占用網(wǎng)格的運(yùn)動(dòng)。此外,預(yù)測(cè)對(duì)象的形狀在未來的時(shí)間步長中會(huì)顯著失去一致性。OpenOccupancy-C的性能遠(yuǎn)優(yōu)于點(diǎn)云預(yù)測(cè)基線,但與PowerEBV-3D和OCFNet相比,估計(jì)當(dāng)前占用率和預(yù)測(cè)未來占用率的能力仍然較弱。

通過在提出的Cam4DOcc基準(zhǔn)上運(yùn)行所有基線方法,作者收集了詳細(xì)的性能數(shù)據(jù)。評(píng)估指標(biāo)包括交并比IoU和視頻全景質(zhì)量(VPQ),這些指標(biāo)衡量了模型在當(dāng)前和未來時(shí)間步的占用預(yù)測(cè)準(zhǔn)確性。

結(jié)果表明,OCFNet在多個(gè)任務(wù)上都取得了更高的IoU分?jǐn)?shù),這表明在預(yù)測(cè)當(dāng)前和未來的占用狀態(tài)方面更為準(zhǔn)確。

為了進(jìn)一步證明OCFNet的優(yōu)勢(shì),作者還進(jìn)行了消融研究,展示了網(wǎng)絡(luò)中不同組件(如流預(yù)測(cè)頭)對(duì)性能的貢獻(xiàn)。

下圖實(shí)驗(yàn)表明,在當(dāng)前和未來的占用率估計(jì)中,完整的OCFNet比沒有流預(yù)測(cè)頭的OCFNet增強(qiáng)了約 4%。原因可能是 3D 流程指導(dǎo)學(xué)習(xí)每個(gè)時(shí)間間隔的 GMO 運(yùn)動(dòng),從而幫助模型確定下一個(gè)時(shí)間戳中占用估計(jì)的變化。

簡(jiǎn)單來講,OCFNet的優(yōu)勢(shì)在于,通過端到端的方式直接預(yù)測(cè)未來的占用狀態(tài),減少了傳統(tǒng)方法中的偽影,提供了更準(zhǔn)確的預(yù)測(cè)結(jié)果。

盡管OCFNet取得了顯著的成果,但如若應(yīng)用在未來的工作上,對(duì)于更長時(shí)間段內(nèi)多個(gè)移動(dòng)物體的預(yù)測(cè),論文認(rèn)為這一任務(wù)仍然具有挑戰(zhàn)性。不過未來的工作可以在此基礎(chǔ)上進(jìn)一步提高預(yù)測(cè)的準(zhǔn)確性和魯棒性。

03.

說到最后,端到端的技術(shù)興起背后

馬斯克的第一性原理同樣可以化套用在自動(dòng)駕駛的能力上。

如果從第一性原理來講,自動(dòng)駕駛就是一個(gè)序列到序列的映射過程,輸入的是一個(gè)傳感器信號(hào)序列,可能包括多個(gè)攝像頭采集到的視頻、Lidar采集到的點(diǎn)云、GPS、IMU 等各類信息,輸出的是一個(gè)駕駛決策序列,例如可以是駕駛動(dòng)作序列,也可以輸出軌跡序列再轉(zhuǎn)為操作動(dòng)作。

這個(gè)過程與大部分AI任務(wù)基本一致,這種映射過程就相當(dāng)于一個(gè)函數(shù)y= f(x),但實(shí)現(xiàn)這種函數(shù)難度較大,任務(wù)復(fù)雜,一般解決方式包括分治法、端到端、傳統(tǒng)分治法等。

端到端的方式原理最為簡(jiǎn)單——直接尋找一個(gè)函數(shù)實(shí)現(xiàn)y=f(x)。

相比之下,端到端自動(dòng)駕駛不進(jìn)行任務(wù)切分,希望直接輸入傳感器數(shù)據(jù)、輸出駕駛決策(動(dòng)作或者軌跡),從而拋棄傳統(tǒng)自動(dòng)駕駛里的感知、預(yù)測(cè)、規(guī)劃、控制等各類子任務(wù)。這種方式有明顯的優(yōu)勢(shì),例如:

•效果上:不但系統(tǒng)更簡(jiǎn)單,還能實(shí)現(xiàn)全局最優(yōu)。

•效率上:由于任務(wù)更少,避免了大量重復(fù)處理,可以提高計(jì)算效率。

•數(shù)據(jù)收益:不需要大量的人工策略、只需要采集足夠多的優(yōu)質(zhì)駕駛數(shù)據(jù)來訓(xùn)練即可,可以通過規(guī)模化的方式(不斷擴(kuò)展數(shù)據(jù))來不斷提升系統(tǒng)的能力上限。

一個(gè)典型的端到端自動(dòng)駕駛系統(tǒng)如圖所示:

輸入:大部分自動(dòng)駕駛汽車都裝載了攝像頭、Lidar、毫米波雷達(dá)等各類傳感器,采集這些傳感器的數(shù)據(jù),輸入深度學(xué)習(xí)系統(tǒng)即可。

輸出:可以直接輸出轉(zhuǎn)向角、油門、剎車等控制信號(hào),也可以先輸出軌跡再結(jié)合不同的車輛動(dòng)力學(xué)模型,將軌跡轉(zhuǎn)為轉(zhuǎn)向角、油門、剎車等控制信號(hào)。

可見,端到端自動(dòng)駕駛系統(tǒng)就像人類的大腦,通過眼睛、耳朵等傳感器接收信息,經(jīng)過大腦處理后,下達(dá)指令給手腳執(zhí)行命令……但是這種簡(jiǎn)單也隱藏了巨大的風(fēng)險(xiǎn),例如可解釋性很差,無法像傳統(tǒng)自動(dòng)駕駛?cè)蝿?wù)一樣將中間結(jié)果拿出來進(jìn)行分析;對(duì)數(shù)據(jù)的要求非常高,需要高質(zhì)量的、分布多樣的、海量的訓(xùn)練數(shù)據(jù),否則 AI 就會(huì)實(shí)現(xiàn)垃圾進(jìn)垃圾出。

與傳統(tǒng)的自動(dòng)駕駛方式對(duì)比可見,同樣的輸入、同樣的輸出,傳統(tǒng)自動(dòng)駕駛包含多個(gè)任務(wù)(多個(gè)模塊),但是端到端只有一個(gè)任務(wù)。此處容易產(chǎn)生一個(gè)誤區(qū),即認(rèn)為傳統(tǒng)的自動(dòng)駕駛是多模塊的、端到端自動(dòng)駕駛是單模塊的,把分模塊與分任務(wù)的概念搞混了。

傳統(tǒng)的自動(dòng)駕駛是分任務(wù)的,必然是多個(gè)模塊。端到端自動(dòng)駕駛可以用單模塊來實(shí)現(xiàn),當(dāng)然也可以用多模塊來實(shí)現(xiàn),其區(qū)別在于是否端到端訓(xùn)練。分任務(wù)系統(tǒng)是每個(gè)任務(wù)獨(dú)立訓(xùn)練、獨(dú)立優(yōu)化、獨(dú)立測(cè)評(píng)的,而端到端系統(tǒng)是把所有模塊看成一個(gè)整體進(jìn)行端到端訓(xùn)練、端到端測(cè)評(píng)的。

例如2023年CVPR best paper提出的UniAD就是一種分模塊端到端訓(xùn)練方式,這種方式通過端到端訓(xùn)練避免了多任務(wù)訓(xùn)練的融合難題實(shí)現(xiàn)全局最優(yōu),又保留了分模塊系統(tǒng)的優(yōu)勢(shì)、可以拋出中間模塊的結(jié)果進(jìn)行白盒化分析,反而更具靈活性對(duì)部署也更友好,如圖所示:

分任務(wù)的自動(dòng)駕駛系統(tǒng)更像model centric系統(tǒng),開發(fā)者通過不斷優(yōu)化各個(gè)模型來提升各個(gè)任務(wù)的效果。而端到端自動(dòng)駕駛則更像data centric系統(tǒng),通過對(duì)數(shù)據(jù)的調(diào)優(yōu)來提升系統(tǒng)效果。

早年,由于自動(dòng)駕駛積累的數(shù)據(jù)還非常少,端到端系統(tǒng)的效果往往比較差。最近幾年,隨著帶高階輔助駕駛功能的量產(chǎn)車大規(guī)模落地,通過海量量產(chǎn)車可以采集到豐富的駕駛數(shù)據(jù),覆蓋各類場(chǎng)景,再加上最近幾年 AI 算力的蓬勃發(fā)展,端到端自動(dòng)駕駛在海量數(shù)據(jù)、海量算力的加持下,取得了突破性進(jìn)展。

以特斯拉為例,通過遍布全球的幾百萬輛量產(chǎn)車,可以采集到足夠豐富、足夠多樣的數(shù)據(jù),再從中選出優(yōu)質(zhì)數(shù)據(jù),在云端使用數(shù)萬張 GPU、以及自研的 DOJO 進(jìn)行訓(xùn)練和驗(yàn)證,使得端到端自動(dòng)駕駛能夠從 paper 變成 product。

到 2023 年初,特斯拉就聲稱已經(jīng)分析了從特斯拉客戶的汽車中收集的1000萬個(gè)視頻片段(clips),特斯拉判斷完成一個(gè)端到端自動(dòng)駕駛的訓(xùn)練至少需要100萬個(gè)、分布多樣、高質(zhì)量的clips才能正常工作。

特斯拉通過分布在全球的幾百萬量產(chǎn)車,基于影子模式,每當(dāng)自動(dòng)駕駛決策與人類司機(jī)不一致時(shí),就會(huì)采集并回傳一個(gè) clip,已經(jīng)累積了 200P 以上的數(shù)據(jù),不管是數(shù)據(jù)規(guī)模、數(shù)據(jù)分布還是數(shù)據(jù)質(zhì)量上都遙遙領(lǐng)先。為了能在云端處理這些數(shù)據(jù),當(dāng)前特斯拉擁有近10萬張A100,位居全球top5,預(yù)計(jì)到今年底會(huì)擁有100EFlops的算力,并針對(duì)自動(dòng)駕駛自研了Dojo,在算力上同樣遙遙領(lǐng)先。

端到端的挑戰(zhàn)比當(dāng)前帶來的驚喜感要更多。

從特斯拉的開發(fā)經(jīng)驗(yàn)來看,端到端自動(dòng)駕駛門檻頗高,其所需的數(shù)據(jù)規(guī)模、算力規(guī)模遠(yuǎn)遠(yuǎn)超出國內(nèi)企業(yè)的承受能力。

科技知識(shí)更多>>

拼“左滑右劃”的年代,如何保障汽車安全? 奇瑞艾瑞澤 8 PRO 2.0T 將于 6 月 19 日上市!升級(jí)馬牌輪胎 領(lǐng)克 09EM-P 大五座限時(shí)煥新價(jià) 23.58 萬元起!定位中大型插混 SUV 東風(fēng)風(fēng)神5月營銷傳播透析 傳播無亮點(diǎn) 銷售老總鄧留超壓力夠大 全新日產(chǎn)聆風(fēng)官圖,跨界純電SUV,國產(chǎn)買嗎? 當(dāng)全新伊蘭特遇見BLACK PINK,北京現(xiàn)代終于開竅了 捷途縱橫G700實(shí)車現(xiàn)身,大過豹8+華為乾崑,配761馬力+三把鎖 零跑汽車?yán)塾?jì)交付量突破80萬臺(tái) 新能源方盒子穿越王牌之爭(zhēng) 深藍(lán)G318無憂穿越版VS方程豹豹5 聊天頁面語音按鍵“變形”!鴻蒙版微信更新,如何“嘗鮮”,官方回應(yīng) 鴻蒙智行登頂新勢(shì)力品牌周銷量第一 迎來加速跑時(shí)代 各地多措并舉促就業(yè),人工智能領(lǐng)域人才需求旺盛 蘋果 iOS 19 新特性曝光:iPhone eSIM 可直接轉(zhuǎn)移至安卓 蘋果未來三年手機(jī)設(shè)計(jì)路線解析:從2025到2027的三代產(chǎn)品升級(jí)變化 內(nèi)部人士回應(yīng)快手強(qiáng)制員工刷短視頻:“并不屬實(shí)” 京東自研無人機(jī)首飛櫻桃季 低空經(jīng)濟(jì)護(hù)航煙臺(tái)櫻桃“飛”向全國 市值82億!“淘寶之父”今日收獲一個(gè)IPO 淘寶 2025 流量爆發(fā)新玩法 廣州5月樓市,冰火兩重天!五一爆單后,二手房卻掛出14.5萬套 天津4月二手房?jī)r(jià)格微降 新房漲幅70城排第三 住進(jìn)70平簡(jiǎn)約新房:從租房到安家,這3個(gè)月裝修值了? 15分鐘快充、座艙功能升級(jí)……來上海車展體驗(yàn)智能化的新能源汽車 新能源車充電自燃,保險(xiǎn)怎么賠?燒到豪車怎么辦?快來了解! 嵐圖夢(mèng)想家刷新智駕安全邊界,蒙眼挑戰(zhàn)背后的五星標(biāo)準(zhǔn)有多強(qiáng)? 日產(chǎn)N7明日廣州上市,智能化升級(jí)訂單火爆,價(jià)格成懸念! 歐拉閃電貓旅行版亮相!\"歐拉精彩生活行動(dòng)\"啟動(dòng),激勵(lì)基金200萬元 吉利發(fā)布“神盾金磚”電池品牌 “科技硬核SUV”銀河戰(zhàn)艦全球首發(fā) 價(jià)格區(qū)間13萬—16萬級(jí),bZ5演繹“五維”純電新價(jià)值 鴻蒙原生版微信正式上架,該有的功能都有了 特斯拉煥新Model Y揚(yáng)言盡管對(duì)比!國內(nèi)新勢(shì)力品牌紛紛“應(yīng)戰(zhàn)”
国产亚洲精品网站_日本77777_在线观看av日韩_天天综合天天添夜夜添狠狠添_成年在线观看视频_欧美大片久久久_国产乱码一区二区三区四区_欧洲在线免费视频_欧美日韩第二页_韩国黄色一级大片_色婷婷综合在线观看_av网站大全免费
免费看精品久久片| 国产精品超碰| 国产专区精品| 香蕉久久国产| 蜜桃一区二区三区在线| 国产亚洲一区在线| 久久久噜噜噜| 免费毛片在线不卡| 日韩一区二区久久| 精品久久视频| 国产精品网在线观看| 午夜欧美精品| 日韩一区欧美| 日韩欧美久久| 日韩中文字幕亚洲一区二区va在线 | 免费国产自线拍一欧美视频| 日韩视频不卡| 亚洲图片久久| 色爱av综合网| 日韩精品欧美大片| 免费日韩视频| 日韩精品影视| 99久久久久国产精品| 精品欧美久久| 欧美日韩国产传媒| 蜜桃tv一区二区三区| 精品一区二区三区在线观看视频| 日本综合视频| 99精品综合| 精品国产欧美| 日韩一区精品| 青草国产精品久久久久久| 国产亚洲精品v| 午夜在线一区| 久久精品国产在热久久| 在线日韩欧美| 国产在线|日韩| 精品久久中文| 日本欧美一区二区在线观看| 久久久精品久久久久久96 | 亚洲视频www| 国产精品自拍区| 日本在线不卡视频| 国产一区2区在线观看| 日韩在线观看不卡| 亚洲男女av一区二区| 一区二区三区国产在线| 中文字幕av一区二区三区四区| 麻豆精品在线观看| 影视先锋久久| 爽好久久久欧美精品| 美女久久精品| 日韩av三区| 日本三级亚洲精品| 天堂中文av在线资源库| 国产精品观看| 国产精品专区免费| 日韩不卡免费视频| 欧美99久久| 日韩中文首页| 中文字幕日韩亚洲| 免费看日韩精品| 日韩在线a电影| av资源中文在线| 久久久久亚洲精品中文字幕| 国内亚洲精品| 综合亚洲色图| 欧美二三四区| 欧美日韩国产高清电影| 国产v日韩v欧美v| 亚洲日产av中文字幕| 欧美成人a交片免费看| 久久精品日韩欧美| 婷婷激情一区| 国产aⅴ精品一区二区三区久久| 国产精品视频一区二区三区综合| 在线免费观看亚洲| 亚洲欧洲美洲av| 首页国产欧美久久| 91亚洲一区| 亚洲视频综合| 国产欧美综合一区二区三区| 日韩不卡在线| 日韩欧美中文字幕电影| 91久久视频| 国产精品普通话对白| 欧美啪啪一区| 蜜桃视频欧美| 综合国产精品| 国产成人精品免费视| 国产欧美日韩视频在线| 丝袜亚洲另类欧美 | 美国av一区二区| 久久国产精品99国产| 青青伊人久久| 亚洲国产福利| 免费观看在线综合| 天堂√中文最新版在线| 日韩精品一页| 五月精品视频| 日本在线不卡视频| 在线中文字幕播放| 久久国产精品久久w女人spa| 国产日韩精品视频一区二区三区| 日韩网站中文字幕| 91亚洲精品视频在线观看| 欧美日韩一区二区三区四区在线观看| 啪啪亚洲精品| 国产美女精品| 麻豆国产欧美日韩综合精品二区| 久久aⅴ国产紧身牛仔裤| 精品视频网站| 日韩二区三区四区| 黄色精品视频| 欧美日韩国产一区二区在线观看| а√天堂8资源在线| 水蜜桃精品av一区二区| 久久久久国产一区二区| 亚洲国产一区二区在线观看| 极品av在线| 亚洲我射av| 日韩精品dvd| 国产精品视频一区视频二区| 亚洲免费婷婷| 亚洲综合激情在线| 丝袜美腿一区二区三区| 欧美精品影院| 精品日韩视频| 久久国内精品视频| 日本亚洲三级在线| 超碰超碰人人人人精品| 亚洲一区免费| 欧美日一区二区三区在线观看国产免| 91精品二区| 日本久久一区| 免费在线小视频| 亚洲一区区二区| 在线观看一区| 欧美福利专区| 免费人成在线不卡| 欧美99久久| 日韩av成人高清| 欧美一级网站| 亚洲免费中文| 综合五月婷婷| 欧美日韩精品在线一区| 激情综合网五月| 最新日韩欧美| 国产欧美日韩精品一区二区免费 | 91精品国产自产观看在线| 久久精品 人人爱| 高清av一区二区三区| 久久亚洲国产精品尤物| 成人小电影网站| 久久中文精品| 最新国产精品视频| 欧美美女一区| 日韩电影免费网址| 亚洲免费福利| 国产一精品一av一免费爽爽| 国产精品久久久久av电视剧| 九九九精品视频| 久久a爱视频| 国产探花在线精品一区二区| 午夜av一区| 日韩欧美美女在线观看| 麻豆精品99| av中文资源在线资源免费观看| 久久中文字幕av| 伊人久久大香线蕉av超碰演员| 国产毛片久久久| 国产日韩欧美三区| 久久精品天堂| 日韩精品91| 在线日韩中文| 色偷偷色偷偷色偷偷在线视频| 91精品蜜臀一区二区三区在线| 国产精品大片免费观看| 国产精品调教视频| 国产精品久久久网站| 国产成人黄色| 日韩影院在线观看| 日韩精品a在线观看91| 精品欧美一区二区三区在线观看| 青青青国产精品| 好吊一区二区三区| 国产拍在线视频| 国产精品美女久久久| 日韩高清一区| 丝袜诱惑一区二区| 五月国产精品| 亚洲大全视频| 国产精品17p| 日韩高清不卡一区二区| 麻豆精品蜜桃| 亚洲尤物av| 日本少妇精品亚洲第一区| 日韩二区三区在线观看| 日韩高清中文字幕一区二区| 婷婷成人在线|