<ruby id="bdh7r"><progress id="bdh7r"><dl id="bdh7r"></dl></progress></ruby>
<progress id="bdh7r"><video id="bdh7r"><span id="bdh7r"></span></video></progress>
<span id="bdh7r"></span>
<th id="bdh7r"></th>
<span id="bdh7r"></span>
<strike id="bdh7r"></strike>
<span id="bdh7r"><dl id="bdh7r"></dl></span>
<ruby id="bdh7r"><dl id="bdh7r"><ruby id="bdh7r"></ruby></dl></ruby>
<progress id="bdh7r"><noframes id="bdh7r"><span id="bdh7r"></span>

特斯拉掀起「端到端」風暴,自動駕駛持續開卷

HiEV大蒜粒車研所 責任編輯:huanganli 發布于:2024-02-22 16:16

最近,特斯拉向在美用戶推送了版本號為V12.1.2 Beta的端到端FSD,版本推送后,海外的特斯拉車主和視頻博主上傳了一些測試視頻,測評視頻本身沒有太多好說的,真正值得關注的是「端到端」。

自馬斯克首秀基于端到端的FSD以來,自動駕駛行業的從業者以及消費者群體中,有很多人對端到端的自動駕駛解決方案表現出了極大的討論熱情。小鵬、小米汽車等已經開卷「端到端」技術。

那么,到底應該怎么理解特斯拉FSD的端到端呢?

理解FSD的端到端

我們可以通過結構、形式、原理、開發范式幾個不同的剖面,理解特斯拉FSD的端到端大模型。

結構上,主流的自動駕駛系統會采取分模塊方案,將AD系統按照感知、規劃和控制進行劃分,先對周圍的動靜態交通參與者和路網結構進行準確感知,再規劃自車的行車軌跡,最后通過執行機構對車輛進行閉環控制。

在分模塊方案中,模塊與模塊之間仿照人類的認知步驟,設計了清晰的接口和界面。

而特斯拉FSD的端到端大模型,則消除了自動駕駛系統的感知和定位、決策和規劃、控制和執行之間的斷面,將三大模塊合在一起,形成了一個大的神經網絡。

(圖片來自網絡)

形式上,分模塊方案的軟件采取人工編碼和神經網絡相結合的形式,且人工編碼存在較高的占比,尤其是規控環節,大部分車企還依賴規則驅動、傳統算法和手工編碼。

相比之下,特斯拉FSD的端到端方案采用全棧神經網絡實現,直接輸入傳感器數據,輸出轉向、制動和加速信號,全程沒有任何編碼。

當然,技術的深海里隱藏著很多秘密,FSD端到端的全棧神經網絡也許只是一種營銷上的說法,并不一定整個自動駕駛軟件里不存在任何代碼。

畢竟,馬斯克在自動駕駛方面向來嘴都比較大,去年第一次展示端到端FSD時就宣稱消除了所有代碼(30多萬行),但他旁邊的助手(聽口音是那位印度裔的自動駕駛部門負責人Ashok Elluswamy)提醒道,FSD里頭還埋著3000多行C++代碼呢!

(圖片來自網絡)

從原理層面看,端到端大模型是對海量駕駛視頻片段的壓縮。

最近,前特斯拉自動駕駛部門負責人Andrej Karpathy做了一期LLM的科普視頻,AK表示,本質上,基于大語言模型LLM的生成式GPT是將互聯網級別TB或PB級的數據壓縮到了GB級別的參數文件里。

類比一下,也可以認為特斯拉端到端的FSD是將上千萬個視頻片段里包含的人類駕駛知識壓縮到了端到端神經網絡的參數里;蛟S,我們可以從人類自身得到更加貼近的類比。

想想我們的一生,吹過那么多的風,淋過那么多的雨,品嘗過一次次的歡笑、淚水、幸福、痛苦,經歷過一個又一個難眠的夜晚,人生的經驗不也在一次次的經歷中被升華、提煉,并最終刻入了腦袋的神經元和突觸里了嗎?

在開發范式上,全棧神經網絡化的FSD是軟件2.0時代的產物,完全基于數據驅動。

即,在神經網絡層數、結構、權重、參數、激活函數、損失函數固定下來后,訓練數據(質量和規模)便成了決定端到端神經網絡性能表現的唯一因素。

分模塊方案介于軟件1.0和2.0之間,除卻采用神經網絡的那部分,采用人工編碼的另一部分依然依賴于設計規則的優劣和傳統算法的性能。

到這里,想必大家對端到端已經有了一定的概念。接下來,同樣結合結構、形式、原理,開發范式,談一談它的優缺點。

端到端的優缺點

特斯拉推翻了用在分模塊方案下的開發、仿真、測試、迭代手段,重構了工具鏈,收集并整理了大量訓練視頻片段,付出了巨大的沉沒成本,新增投入了巨大的資源。那么,以逐利為天性的資本家的卓越代表馬斯克,到底看上了端到端的什么優點?

圖片來自廣汽研究院)

我們可以借用廣汽研究院這張PPT,它很好地總結了端到端大模型相較于分模塊方案的優缺點。優點有三:

具備更高的技術上界;

數據驅動解決復雜長尾問題;

消除嚴重的模塊累計誤差;

缺點有二:

缺乏可解釋性;

需要海量的高質量數據。

「具備更高的技術上界」是因為可以進行整體優化。端到端的一體化結構方便進行聯合優化、尋求整體最優解。

端到端大模型能夠服務于整體目標、實現全局最優,和它的全棧神經網絡形式息息相關。一個大一統的感知、預測、規劃和控制網絡,可以使用鏈式法則無障礙地從輸出層(橫縱向控制)向輸入層(傳感器)逐層反向傳播誤差,以最小化整體損失函數為目標,更加準確地更新每個網絡層中的參數。

這顯然是分模塊自動駕駛方案無法實現的,在分模塊方案里,模塊與模塊之間存在「梯度斷開」現象。

看看下面這張圖就知道了,想一層層地反向傳播,必須保證中間鏈條不能斷,只要神經網絡中間有一層出現了中斷,反向傳播就只能望河興嘆了。

(圖片來自網絡)

「消除嚴重的模塊累計誤差」同樣來自于全棧神經網絡的貢獻。

大家可以把具備多層結構的神經網絡的前向傳播理解為進行多次函數計算,上一層和下一層之間能否傳遞全量信息是運算是否準確的關鍵。

對于分模塊方案來說,模塊和模塊之間無法傳遞全量信息,導致了「累計誤差」,相較之下,全棧神經網絡上下層之間可以傳遞全量信息,從而消除了模塊累計誤差。

「數據驅動解決復雜長尾問題」這個表述可能會讓很多人蒙圈,畢竟,建立數據閉環,以數據驅動覆蓋更多的corner case,是過去一兩年里國內車企的宣傳重點。其實沒有矛盾,本土車企著力宣傳的BEV、Transformer、占用網絡面向的是基于數據驅動的感知,但在規控層面,大部分車企還是基于規則。

和感知一樣,規控同樣面臨長尾問題。

基于規則和數據驅動都是解決復雜長尾問題的方式。算法、算力、數據是驅動人工智能發展的三要素,在這個框架下,可以認為Rule based是「算法驅動」,端到端大模型是「數據驅動」。

與其針對層出不窮的復雜長尾問題,手工編碼規控策略,不如設計規控神經網絡,通過長尾場景下的訓練數據更新模型參數,從理論上來說這是更加一勞永逸的做法。

端到端「缺乏可解釋性」確實是客觀存在的缺點。不過,不只是FSD端到端,互聯網巨頭正在搞的GPT和生成式AI的可解釋性也非常差,科學家到現在也沒有研究明白大模型突現的行為和涌現的能力到底來自哪兒。

GPT和端到端FSD遵循的都是大算力+海量數據的暴力美學,能力來源和機制目前還難以精確地解答。

不過,雖然解釋性差,互聯網巨頭們還是頭也不回地加碼大模型賽道,消費者們也把它們用出了花。很多事情要知其然知其所以然,端到端和生成式大模型的機制,也許科學家們會在未來給出解答。

「需要海量的高質量數據」與其說是一個缺點,倒不如說是門檻。

在自動駕駛技術的世界,訓練算力、數據、AI人才、資金都需要門檻,而在這些要素中,數據是最重要的。

Andrej Karpathy曾經在一次訪談中表示過,特斯拉自動駕駛部門將3/4的精力用在采集、清洗、分類、標注高質量的數據上面,只有1/4的工作用于算法探索和模型創建,這種精力分配,足以說明數據在特斯拉自動駕駛技術棧中的地位。

尤其是端到端這種完全數據驅動的大模型,數據的規模和質量比參數量更能決定模型本身的表現。

端到端的訓練投入

2023年7月的特斯拉Q2財報電話會議上,馬斯克曾經介紹過端到端FSD的訓練規模:

「特斯拉花了大約一個季度的時間完成了1000萬個視頻片段的訓練。訓練了100萬個視頻case,勉強可以工作;200萬個,稍好一些;300萬個,就會感到Wow;到了1000萬個,它的表現就變得難以置信了!

訓練視頻片段當然不會止步于1000萬。

事實上,訓練工作是一直源源不斷進行的,特斯拉一方面繼續收集高質量的視頻片段,一方面繼續加大訓練算力的投入,以提高訓練效率、縮短訓練時間。

2023年的特斯拉投資者日上,馬斯克公開表示,到2025年底,特斯拉會將訓練算力推高到100E。和國內廠商1-2E(華為最近的公開數據為2.8E)的訓練算力相比,100E是一個相當驚人的數字。

最近這段時間,Dojo負責人離職,大概率會影響「道場」的部署,而且,那么多廠商在搶英偉達的A100/H100,特斯拉未必能如愿買到那么多芯片,所以,特斯拉的訓練算力能推高到什么程度,也許比馬斯克的預言稍微保守一些(在自動駕駛上,馬斯克的預言一向是夸張的)。

即便如此,相比國內廠商,特斯拉的訓練算力依然高出一個數量級,這也是為何特斯拉可以訓練端到端大模型,而國內車企還停留在「預研」階段的緣故。

以上講了端到端和分模塊方案的區別、端到端的優缺點和門檻,再說回視頻表現,如果不知道FSD采用了端到端,想必本土頭部車企會把特斯拉打得找不著東了,或者像少年閏土那樣眼里閃著光,將特斯拉當成叉子下的猹一樣扎去了。

但是一旦冠以了端到端的名義,很多人就像中年的閏土見到魯迅那樣恭恭敬敬地喊起老爺來了。其實大可不必,筆者看了幾個測試視頻,端到端FSD并沒有在體驗上超出國內頭部車企,結合與幾位行業內人士的交流,大家一致認為特斯拉目前并沒有從實踐上證明端到端真的100%確定是一個值得追隨的路線。

而且,正如前文提到的,端到端的可解釋性差,萬一也存在天花板呢,目前篤定端到端路線會超過分模塊方案還早了一點。

大模型也是這樣,周鴻祎最近不還說原以為是個原子彈,現在才發現是個茶葉蛋嘛!

最穩妥的方式是一邊預研,一邊觀察看看FSD一年內的表現和進展,也可以在特斯拉即將舉行的AI Day上研究一下端到端大模型的技術細節。

不過,在2023年第四季度財報電話會議上,預測特斯拉將在今年第一季度舉辦AI Day的分析師問馬斯克,可不可以對AI Day抱有期待時,老馬直接表示:「我們發現,特斯拉舉辦AI Day以后,友商們會一幀幀地觀摩我們的PPT,所以我們必須小心謹慎地披露我們的秘籍!

現在就盼著馬斯克不要那么小氣吧!

本文來源:HiEV大蒜粒車研所 三少爺

HiEV大蒜粒車研所

網友評論

聚超值•精選

最新內容

特斯拉掀起「端到端」風暴,自動駕駛持續開卷

自馬斯克首秀基于端到端的FSD以來,自動駕駛行業的從業者以及消費者群體中,有很多人對端到端的自動駕駛解決方案表現出了極大的討論熱情。小鵬、小米汽車等已經開卷「端到端」技術。

特斯拉 |自動駕駛
春節不打烊的商場賣車人:有人5天賣20多臺,有人賣一臺凈賺超2000元

隨著新能源汽車的普及,選擇將汽車銷售門店開進商場,正在成為眾多汽車廠商的普遍選擇。這些位于商場的汽車銷售門店俗稱商超店。

汽車銷售門店 |新能源汽車
比亞迪打出“798”,中國車市卷出新高度

去年3月,比亞迪董事長王傳福在一場面向投資者的溝通會上表示,“在中國汽車市場10到20萬元的價格帶內,比亞迪有產品定價權,但我不想搞得大家很難受,別人都沒活路!

比亞迪 |價格戰
焦慮的理想汽車:丟掉銷冠,CEO李想「陰陽怪氣」復盤

今年1月,在造車新勢力月銷榜中,問界首次超越理想成為第一。這也讓此前李想稱“華為是理想的勁敵”這一觀點,再次成為現實。隨著產品線越來越重合,雙方的全面戰爭一觸即發。

理想汽車 |問界
中國的“電動保時捷”,咋就造不下去了?

2月18日,也就是春節假期后開工的第一天,高合汽車召開了內部大會,宣布從即日起停工停產六個月,以及減薪、逼迫員工主動離職的舉措。

高合汽車 |停工停產
太平洋科技旗下
讀懂科技出行 · 聚焦未來出行趨勢
微信公眾號
B站
新浪微博
聯系我們
二維碼 回到頂部
野花社区WWW官网,舌尖伸入湿嫩蜜汁呻吟,国产A∨精品一区二区三区,性做久久久久久久久