理想智能駕駛又有大動(dòng)作
李想:“掌控自己的命運(yùn),挑戰(zhàn)成長(zhǎng)的極限?!?/span>
一、“端到端”的風(fēng)吹到了理想
今年下半年的智能駕駛風(fēng)潮,似乎是由“端到端”引領(lǐng)著,現(xiàn)在各家玩智駕的車(chē)企好像不搞“端到端”就顯得自己比別人落后了一分。
在華為、小鵬、蔚來(lái)等企業(yè)紛紛跟進(jìn)端到端智能駕駛的研究后,今年7月初理想在一次發(fā)布會(huì)上表示自己也要摻和一腳。

圖源:理想端到端模型
據(jù)媒體報(bào)道,近期的理想還專(zhuān)門(mén)成立了“端到端自動(dòng)駕駛”實(shí)體組織,初步估計(jì)人數(shù)在200左右,并且公司其他團(tuán)隊(duì)也會(huì)靈活支援這個(gè)項(xiàng)目。
雖然在此之前理想曾公布過(guò)自己的端到端架構(gòu),但那會(huì)有不少人認(rèn)為這還停留在“PPT層面”,而現(xiàn)在看來(lái)理想這次可不只是說(shuō)說(shuō)而已,是要?jiǎng)诱娓窳恕?/span>
自去年下半年以來(lái),受到特斯拉的影響,國(guó)內(nèi)智能汽車(chē)行業(yè)就掀起了一股端到端技術(shù)的研究熱潮。
眾多車(chē)企紛紛將目光投向這一領(lǐng)域,試圖在自動(dòng)駕駛技術(shù)的新賽道上搶占先機(jī)。端到端技術(shù),這個(gè)原本只在學(xué)術(shù)范圍內(nèi)討論的概念,一時(shí)間成為了行業(yè)熱詞。
既然要聊“端到端”,特斯拉的FSD V12無(wú)疑是一個(gè)繞不開(kāi)的話(huà)題。
首先,端到端智能駕駛模式,就是由特斯拉給帶火的。
并且,特斯拉以其在自動(dòng)駕駛領(lǐng)域的深厚積累,已經(jīng)通過(guò)FSD V12開(kāi)始嘗試將端到端技術(shù)應(yīng)用到實(shí)際產(chǎn)品中,說(shuō)它是目前端到端智駕的龍頭老大哥也不為過(guò)。
特斯拉的創(chuàng)始人馬斯克對(duì)端到端技術(shù)充滿(mǎn)了信心。他曾在多個(gè)場(chǎng)合表示,端到端技術(shù)是自動(dòng)駕駛的未來(lái)。
他甚至在社交媒體上宣稱(chēng),FSD V12通過(guò)神經(jīng)網(wǎng)絡(luò),將人工編程的C++控制代碼由30萬(wàn)行縮減到了3000行,但有媒體質(zhì)疑過(guò)這番言論的真實(shí)性,只不過(guò)馬斯克本人并未出面辯解。
那么說(shuō)了這么多,端到端技術(shù)究竟是什么?它與之前的智能駕駛技術(shù)又有何不同?
簡(jiǎn)單來(lái)說(shuō),端到端技術(shù)是一種全新的自動(dòng)駕駛解決方案。
在傳統(tǒng)的自動(dòng)駕駛系統(tǒng)中,通常采用的是模塊化的方法,即將整個(gè)自動(dòng)駕駛?cè)蝿?wù)分解為感知、規(guī)劃、決策等多個(gè)模塊,每個(gè)模塊負(fù)責(zé)處理特定的任務(wù)。
而端到端技術(shù)則打破了這種模塊化的界限,它將自動(dòng)駕駛的整個(gè)過(guò)程視為一個(gè)整體,從輸入的傳感器數(shù)據(jù)到最終的車(chē)輛控制指令,全部由一個(gè)統(tǒng)一的神經(jīng)網(wǎng)絡(luò)模型來(lái)完成。
如果將自動(dòng)駕駛比作一場(chǎng)接力賽,那么傳統(tǒng)的模塊化方法就像是一場(chǎng)長(zhǎng)跑接力賽,其中每個(gè)模塊就像是一名接力選手,他們需要一棒接一棒地完成比賽。
而端到端技術(shù)則像是單人長(zhǎng)跑,整個(gè)比賽過(guò)程由一名選手獨(dú)立完成,無(wú)需交接棒。
端到端技術(shù)的優(yōu)勢(shì)在于,它能夠減少模塊間傳遞信息時(shí)的損失和延遲,提高系統(tǒng)的響應(yīng)速度和決策效率。同時(shí),由于整個(gè)系統(tǒng)由一個(gè)統(tǒng)一的模型來(lái)控制,它可以更好地進(jìn)行全局優(yōu)化,提高自動(dòng)駕駛的性能。
更重要的是,端到端技術(shù)可以讓整個(gè)智駕模式只需要調(diào)用一個(gè)大模型。
在馬斯克的設(shè)想中,原來(lái)的模塊化模式,會(huì)將自動(dòng)駕駛操作分為不同層級(jí)進(jìn)行處理,每個(gè)層級(jí)需要調(diào)用一至多個(gè)大模型來(lái)收集信息,處理信息,輸出信息。

圖源:B站
而端到端就可以將上述步驟全部交給一個(gè)大模型來(lái)做,這樣輸入和輸出的數(shù)據(jù)參數(shù)都在一個(gè)模型上跑,一定程度上也減少了決策誤差。
不過(guò),端到端技術(shù)同樣有著其負(fù)責(zé)的另一面。例如,如何設(shè)計(jì)出一個(gè)能夠處理各種復(fù)雜交通場(chǎng)景的統(tǒng)一模型,如何保證系統(tǒng)的安全性和可靠性等問(wèn)題就令人十分頭疼。
好在國(guó)內(nèi)的車(chē)企目前對(duì)于端到端技術(shù)的研究并非一蹴而就,而是都在先做好自己手頭的智駕方案,各家也都在推動(dòng)自己的NOA加快落地多個(gè)城市。
比如理想汽車(chē)此前就先是提出城市NOA落地100城的目標(biāo),隨后又調(diào)整為“通勤NOA100城”,以應(yīng)對(duì)華為和小鵬的智能駕駛沖擊。
而到了今年7月,隨著理想汽車(chē)端到端+視覺(jué)語(yǔ)言模型早鳥(niǎo)計(jì)劃的公布,CEO李想公開(kāi)表達(dá)了自己的豪言壯志:“到今年底或明年初,理想將推出端到端+VLM的自動(dòng)駕駛方案。”
這一方案將由超過(guò)1000萬(wàn)個(gè)視頻片段訓(xùn)練而成,且理想還計(jì)劃將參數(shù)達(dá)22億的視覺(jué)語(yǔ)言大模型搬上車(chē)。
這次的組織成立僅僅是個(gè)開(kāi)始,最后到底能不能成,做出來(lái)的“端到端”在行業(yè)內(nèi)又能排到哪個(gè)位置,一切都要等時(shí)間給我們答案了。
二、理想汽車(chē)的雄心
理想作為如今勢(shì)頭正盛的新能源新勢(shì)力,如果只是單純宣布要跟進(jìn)做“端到端智駕”,好像也是件正常的事,畢竟目前這個(gè)汽車(chē)市場(chǎng)屬于“不進(jìn)則退”。
但有意思的地方就在,理想這一次的技術(shù)思路,與特斯拉有著諸多相似之處。
正如我之前所說(shuō),特斯拉通過(guò)一個(gè)統(tǒng)一的神經(jīng)網(wǎng)絡(luò)模型,實(shí)現(xiàn)了從傳感器數(shù)據(jù)到車(chē)輛控制指令的直接映射。
理想汽車(chē)同樣采用了這一技術(shù)路線(xiàn),但其在具體實(shí)現(xiàn)上有著其獨(dú)特的創(chuàng)新——理想的具體方案,包括端到端模型、視覺(jué)語(yǔ)言模型(VLM)和世界模型三部分。
這意味著在車(chē)輛做出的自動(dòng)駕駛決策中,除了和特斯拉一樣由端到端模型直接處理外,還能由視覺(jué)語(yǔ)言模型與云端的世界模型進(jìn)行輔助控制與糾正,聽(tīng)起來(lái)多了些可靠性和安全性。
那么其他家是怎么做的呢,這三個(gè)模型具體又有啥用?
我們可以看到,華為在端到端技術(shù)上的布局,主要集中在其ADS系統(tǒng)。華為的ADS系統(tǒng)采用了一種結(jié)合少量人工規(guī)則與端到端模型的技術(shù),并正逐步減少對(duì)人工規(guī)則的依賴(lài)。

圖源:華為ADS3.0發(fā)布會(huì)截圖
華為的系統(tǒng)主要包含兩個(gè)關(guān)鍵部分:GOD(通用障礙物檢測(cè))和PDP(預(yù)測(cè)決策規(guī)控)。GOD網(wǎng)絡(luò)使得ADS在障礙物識(shí)別方面實(shí)現(xiàn)了較大的飛躍,而PDP網(wǎng)絡(luò)則將預(yù)測(cè)、決策和規(guī)劃整合為一個(gè)統(tǒng)一的網(wǎng)絡(luò)。
小鵬汽車(chē)則通過(guò)其XNGP系統(tǒng),采用了分段式端到端技術(shù)。

圖源:小鵬汽車(chē)官網(wǎng)
XNGP系統(tǒng)由神經(jīng)網(wǎng)絡(luò)感知網(wǎng)絡(luò)XNet、規(guī)控大模型XPlanner和大語(yǔ)言模型XBrain三個(gè)部分分段完成智駕的感知到?jīng)Q策的過(guò)程。
這種分段式的方法,雖然在技術(shù)上與理想汽車(chē)的一體化模型有所不同,但理論層面上與它也差異不大。
具體對(duì)比理想汽車(chē)的這三個(gè)模型來(lái)看,理想的可以說(shuō)有創(chuàng)新,有想法,待實(shí)現(xiàn)。
據(jù)官方介紹,理想汽車(chē)的端到端模型,是通過(guò)接收傳感器輸入,并直接輸出行駛軌跡用于控制車(chē)輛,實(shí)現(xiàn)從感知到?jīng)Q策的無(wú)縫銜接,太有特斯拉的味道了。
值得一提的是,在理想的端到端技術(shù)方案中,"4D One Model"是一個(gè)關(guān)鍵的創(chuàng)新點(diǎn)。它可以通過(guò)整合感知、定位、規(guī)劃和導(dǎo)航等多個(gè)模塊,實(shí)現(xiàn)從傳感器數(shù)據(jù)到車(chē)輛控制指令的直接映射。
理論上來(lái)說(shuō),它也使得理想汽車(chē)在處理復(fù)雜交通場(chǎng)景時(shí),能夠更加精準(zhǔn)和可靠。
另一個(gè)VLM系統(tǒng)則是通過(guò)視覺(jué)語(yǔ)言模型,對(duì)環(huán)境進(jìn)行深入理解和分析。
主要的作用還是識(shí)別和分析道路標(biāo)志、交通信號(hào)等多種視覺(jué)信息,從而為駕駛決策提供更加豐富和準(zhǔn)確的數(shù)據(jù)支持。
但有一說(shuō)一,這樣的VLM僅從功能來(lái)看并沒(méi)有啥區(qū)別于其他家的創(chuàng)新點(diǎn),能不能和特斯拉或華為的智駕識(shí)別系統(tǒng)相比更是難說(shuō)。
不過(guò)最后這個(gè)所謂的世界模型倒是有些意思。世界模型通過(guò)模擬和預(yù)測(cè)車(chē)輛周?chē)沫h(huán)境和交通狀況,為駕駛決策提供了更加全面和深入的背景信息。
這種世界模型的構(gòu)建,提升了系統(tǒng)的預(yù)測(cè)能力和規(guī)劃能力。
更關(guān)鍵的是,它的存在讓理想的端到端并不完全脫離云端,這就沒(méi)有了網(wǎng)友們之前所說(shuō)“端到端與傳統(tǒng)的不同就像‘Siri’和‘ChatGPT’之間的差異。”
三、理想要落地端到端還早著呢
說(shuō)了這么多,還是不得不講出那句話(huà):理想很豐滿(mǎn),現(xiàn)實(shí)很骨感。
正如任何前沿技術(shù)一樣,理想在推進(jìn)端到端技術(shù)的過(guò)程中,也不可避免地面臨著一系列的挑戰(zhàn)和難題。
首先,端到端技術(shù)的核心在于算法的優(yōu)化和數(shù)據(jù)處理的能力。并且隨著駕駛場(chǎng)景增多與復(fù)雜化,對(duì)于這兩個(gè)方面的要求還在提高,這還只是理想未來(lái)要解決的基礎(chǔ)問(wèn)題。
其次,實(shí)現(xiàn)端到端智能駕駛,不僅需要先進(jìn)的算法,還需要強(qiáng)大的計(jì)算資源,理想汽車(chē)需要大量的訓(xùn)練數(shù)據(jù)來(lái)優(yōu)化模型。
就連馬斯克都說(shuō)FSD要完成端到端需要60億英里的訓(xùn)練數(shù)據(jù),而目前僅實(shí)現(xiàn)6分之一,這對(duì)于剛起步不久的理想更是一場(chǎng)挑戰(zhàn),其在這方面的投入和努力,將直接影響到端到端技術(shù)的實(shí)際效果和可靠性。
此外,面對(duì)法律法規(guī)對(duì)智駕的限制、市場(chǎng)對(duì)新技術(shù)的適應(yīng)周期,還有其他眾多競(jìng)爭(zhēng)對(duì)手的虎視眈眈等諸多困難,理想汽車(chē)又該如何應(yīng)對(duì)呢?
還得看看理想有多大魄力,李想有多大決心。
2、電商號(hào)平臺(tái)僅提供信息存儲(chǔ)服務(wù),如發(fā)現(xiàn)文章、圖片等侵權(quán)行為,侵權(quán)責(zé)任由作者本人承擔(dān)。
3、如對(duì)本稿件有異議或投訴,請(qǐng)聯(lián)系:info@dsb.cn