從美國試駕完特斯拉FSD回來,小鵬智能駕駛負責(zé)人李力耘有兩大感受。其一是,特斯拉FSD在北美地區(qū)的確是獨一檔,但他也意識到,需要對特斯拉祛魅。
“中美路況非常不一樣,我們更懂中國路況,更懂國人的駕駛習(xí)慣,特斯拉可能更懂美國人的駕駛習(xí)慣,很難說誰更強!崩盍υ耪f。
角逐和較量在智駕圈里已經(jīng)不新鮮。過去一年里,小鵬等車企迅速卷入了“全國都能開”“端到端”的智能駕駛競爭。
在今年12月末,小鵬還計劃交付“車位到車位”智駕駕駛功能,技術(shù)模型也升級為“一段式端到端”,可實現(xiàn)全場景覆蓋,包括園區(qū)低速行駛,未來會覆蓋泊車、高速場景,甚至海外智駕。
“車位到車位”是當(dāng)下車企智能駕駛競爭的技術(shù)高地。如字面含義,車企希望用戶在車位就能啟動智駕,車輛低速巡航、自主過閘機、上高速,在城市道路通行,最后泊入目的車位。
12月初,特斯拉向部分測試用戶推送的特斯拉FSD v13.2更新版本,就包含了從停車狀態(tài)啟動的FSD,也就是“車位到車位”功能。前不久理想汽車也宣布突出該功能,華為和小米汽車的類似功能,同樣即將推出。
智能駕駛走向自動駕駛的過程不是一蹴而就,而是車企們通過技術(shù)攻堅,不斷完成高速、城區(qū)、泊車、園區(qū)等場景拼圖。如今,這一步即將完成。
李力耘也表示,現(xiàn)在小鵬處于“無人化(駕駛)前夜”,明年在能力上會有更大突破,“可能先在Max車型上,小鵬智駕逐步提供類似無人駕駛的能力!
小鵬的確是國內(nèi)最早貼上“智駕”標簽的車企之一。2019年,小鵬就在轎跑車型P7上開發(fā)了高速NGP功能,對標特斯拉NOA。
但因為起步早,小鵬幾乎走過所有技術(shù)路線,從依賴高精地圖,轉(zhuǎn)向無圖方案,隨后進化到端到端。2023年8月,小鵬智駕還經(jīng)歷了靈魂人物吳新宙離職、團隊動蕩等。小鵬智駕由此進入守城階段。
同一時期,行業(yè)有玩家迅速進入了高階智駕量產(chǎn)狀態(tài)。比如壓強式投入的華為,率先推出了“全國都能開”智駕功能;理想汽車則由于輕包袱,果斷切入“端到端”技術(shù),甚至直接更換到激進的“一段式端到端”方案。
近日,小鵬智駕負責(zé)人李力耘接受了36氪的采訪,他分享了小鵬如何將AI融入智駕,以及標配純視覺智駕后,如何實現(xiàn)科技平權(quán)與商業(yè)閉環(huán)。
李力耘告訴36氪,小鵬對于端到端的研發(fā)始于2023年4月,當(dāng)時主要是想用AI的認路能力,擺脫對高精地圖的依賴。
結(jié)果小鵬發(fā)現(xiàn),“一段式端到端”大模型上線之后,原來需要花很長時間打磨的場景,如特殊分流、右轉(zhuǎn)或掉頭等問題,很快就被解決了。
今年5月,小鵬正式推出“端到端”智駕大模型,包含神經(jīng)網(wǎng)絡(luò)XNet、規(guī)控大模型XPlanner、大語言模型XBrain三大部分。
端到端智駕依賴的核心資源之一就是數(shù)據(jù),小鵬宣稱,其端到端大模型訓(xùn)練數(shù)據(jù)量已經(jīng)達到2000萬clips。理想汽車也公開過其端到端的訓(xùn)練數(shù)據(jù),目前大約在800萬clips。
對于2000萬clips的數(shù)據(jù)起點,李力耘告訴36氪,這得益于過去基于規(guī)則的智駕經(jīng)驗積累,小鵬當(dāng)前的數(shù)據(jù)采集和訓(xùn)練效率很高,例如通過車端規(guī)則經(jīng)驗實時標注,精準采集訓(xùn)練所需片段,從而針對目標場景進行精準密集訓(xùn)練。
他同時認為,在海量數(shù)據(jù)、不斷提升的云端和車端算力下,自動駕駛的Scaling Law還有很大紅利。
Scaling Law是大模型行業(yè)的一個定律,通常表示模型參數(shù)越大、數(shù)據(jù)集越大和計算資源增多,模型性能更好。
小鵬推出“端到端”大模型智駕方案的標志性成果,就是更果斷擺脫對激光雷達的依賴,將純視覺作為智駕技術(shù)路線+上,小鵬就標配了純視覺智駕AI鷹眼方案。
但在行業(yè)中,未來數(shù)年的主流選擇還是以視覺+激光雷達作為主要傳感器。對此,李力耘向36氪汽車表示,走純視覺路線其實是出于第一性原理。
在他看來,人們生活的交通環(huán)境,包括路牌、路標、紅綠燈,整個道路甚至車的造型都是為人設(shè)計的,“人最重要的傳感器是眼睛,所以純視覺一定是最直接、最高效的解決方案!
小鵬也宣稱,其基于AI鷹眼的純視覺方案,能做到比人眼視覺更好的效果,可以很好應(yīng)對大光差、逆光場景。
在純視覺智駕之路上,小鵬汽車決定走到底,李力耘告訴36氪,從P7+車型開始,不再有Max和Pro的版本區(qū)分,而是“全系標配Max,也就是小鵬 AI 圖靈智駕(NGP),都會用純視覺方案!
這背后蘊含著一套清晰的智駕商業(yè)化策略,“我們會用一段式端到端放大我們的車型優(yōu)勢,不僅標配所有車型,更希望覆蓋所有功能,實現(xiàn)點到點,包括賦能海外的智駕!奔円曈X智駕方案,無疑在成本上擁有先天優(yōu)勢。
實際上,憑借在同級車型中做出“智能差異化”的賽馬策略,小鵬已經(jīng)在兩款新車 MONA M03和P7+上,嘗到了甜頭。
M03自9月上市以來連續(xù)3個月銷量破萬,P7+上市3小時也獲得了超3萬大定。這兩款車的售價都在20萬元以下,這個價格帶是比亞迪等老牌車企的優(yōu)勢領(lǐng)域。
“智駕是小鵬P7+用戶購車的 top 理由!崩盍υ耪f,當(dāng)下熱銷款M03的泊車體驗也與Max版智駕同級。
智能駕駛技術(shù)在車企的商業(yè)體系里已經(jīng)越嵌越深,同時,也在承接整個AI技術(shù)的發(fā)展紅利,快速迭代。這是資源和效率交織的產(chǎn)物。
李力耘說,如果把端到端的技術(shù)趨勢看作智能駕駛駕領(lǐng)域的一場“工業(yè)革命”,能真正實現(xiàn)轉(zhuǎn)型升級的企業(yè)其實是少數(shù),大部分人還是會面臨更殘酷的競爭。
因為,端到端不是讓事情變得更簡單,而是讓整個迭代鏈條變得更長,更加不可控,某種程度上需要投入更多的資源,包括更大算力,更加精英的AI研究人員。
李力耘:但很遺憾,因為v13還沒有量產(chǎn)推給用戶,我沒機會試FSD v13,但開了一個星期v12.5。有兩點可以總結(jié),第一是祛魅,第二特斯拉在北美是獨一檔的存在,很多值得學(xué)習(xí)的地方,包括停車場激活、開進停車場,這些是用戶非常喜歡的功能。
去魅的話,我覺得中美路況非常不一樣,無論是我們XNGP 5.4.0還是即將發(fā)布的5.5.0 版本,智駕都和特斯拉不相伯仲。我們更懂中國路況,更懂國人的駕駛習(xí)慣,特斯拉可能更懂美國人的駕駛習(xí)慣,很難說誰更強,我非常期待FSD進入中國之后的表現(xiàn)。
李力耘:從技術(shù)方法論上,小鵬和特斯拉、OpenAI 這樣的全球AI企業(yè)不謀而合,我們強調(diào)云端大模型,參數(shù)量是車端80倍以上。我們云端大模型的訓(xùn)練數(shù)據(jù)量達到2000 萬以上clips。每個clips可以理解成大約一分鐘的小電影。每個模型都基于大量數(shù)據(jù)、在云端訓(xùn)練。我們有個說法叫“云上一天,地上三五年”。
李力耘:我們即將推給用戶的XOS 5.5.0版本上,用“一段式端到端”給用戶提供了一個完整的“車位到車位”體驗。其實在停車場和地庫,2021 年我們就推出了VPA(記憶泊車)功能,但用戶體驗并不好,用戶滲透率沒有城區(qū)智駕那么高。
所以,我們用“一段式端到端”實現(xiàn)所有車型標配后,現(xiàn)在去實現(xiàn)全場景覆蓋,包括“車位到車位”低速行駛、園區(qū)行駛,未來還會覆蓋泊車、高速,甚至海外智駕。我們希望給用戶帶來更加連貫、絲滑的體驗,而不是有割裂感、類似于VPA+NOA的組合體驗。
李力耘:第一次肯定沒有地圖,很難,如果有園區(qū)內(nèi)導(dǎo)航指引會好一些。就像你第一次去一個地庫,也需要一些指引或者借助他人的記憶,我們可以做到無感學(xué)習(xí)和記憶。第二次去就可以有絲滑的“車位到車位”能力。
李力耘:最大區(qū)別還是體驗層面。小鵬智駕在2024年最大的兩個變化,第一是 AI化,面向AI進行組織變革,進行AI能力提升,另一個變化是,我們覺得用戶不會為更好的科技買單,但一定會為更好的體驗買單。
用端到端大模型賦能“車位到車位”后,用戶體驗會大大提升,雖然有時候可能需要學(xué)習(xí)、參考先驗信息,但學(xué)習(xí)感會很弱。
36氪汽車:今年智駕行業(yè)變化很大,年初卷“全國都能開”,后來變成端到端,現(xiàn)在是“車位到車位”,您怎么看這種競爭?明年的競爭重點是什么?
今年從“全國能開”逐步走向端到端,比拼的是博弈能力、比拼擬人化。到“車位到車位”之后,我覺得我們處在“無人化的前夜”階段,小鵬智駕會篤定地走向無人駕駛。
我們希望,明年在能力上有所突破,可能先在Max車型上,小鵬智駕逐步提供類似無人駕駛的能力,接管次數(shù)無限降低。隨著法規(guī)推進,或者新車型推出,我們一定會做出走向無人化的能力。小鵬的最終目標是解放駕駛員的雙手、解放精力。
李力耘:小鵬是Scaling Law的忠實信徒。雖然最近很多AI前沿工作說Scaling Law、預(yù)訓(xùn)練遇到了瓶頸。但從算力、數(shù)據(jù)量來看,我覺得自動駕駛的Scaling Law還有很大紅利。
數(shù)據(jù)方面,互聯(lián)網(wǎng)優(yōu)質(zhì)數(shù)據(jù)大概600-700T之后就會有瓶頸。但智駕大部分企業(yè)今年才逐步轉(zhuǎn)向端到端,自動駕駛大量優(yōu)質(zhì)駕駛數(shù)據(jù)積累還沒有到盡頭。
另外,無論車端還是云端算力,都會有著更顯著的增長,模型參數(shù)也會進一步擴大。我覺得自動駕駛的Scaling Law還沒有到盡頭。
李力耘:我不反對。這些觀點在以不同的視角來描述端到端,在我看來可能殊途同歸。無論是視覺語言大模型,還是視覺動作大模型,本質(zhì)是通過大量數(shù)據(jù)輸入,有一定推理能力,很好地實現(xiàn)類人駕駛的模型。
小鵬以視覺為主,我們實現(xiàn)了“光子進、控制出”。當(dāng)然,從多模態(tài)輸入角度來看,視覺只是一個傳感器,本身還有各種車道、GPS或者是各種各樣多模態(tài)輸入。
網(wǎng)上的海量數(shù)據(jù)會讓模型有更強的認知能力,識字認路。但是我們認為,擁有高質(zhì)量的、豐富駕駛數(shù)據(jù)可以更好解決車輛駕駛的小腦問題,這跟大模型不沖突。
很多駕駛是相對本能的動作,就像人類的小腦,當(dāng)然也需要大腦的能力。所以在我們的一段式端到端大模型中,Xbrian可以認路識字,做一些簡單推理,但更多時候還是對加減速控制、變道時機選擇,或者繞行處理,更偏本能的小腦行為。
李力耘:2023年4月份,我們開始布局整個“端到端”技術(shù)棧。那時候我們希望用端到端來解決對高精地圖的依賴問題,做到全國都能開,所以當(dāng)時智駕AI化,更注重識路、找路。2023年底,我們意識到需要把端到端的能力進一步擴大,做成一段式端到端。
李力耘:當(dāng)時主要在開城,狀態(tài)很難,因為把高精地圖的拐杖扔掉之后,嘗試用實時算法去認全國各種各樣的路況,并且讓車能夠配合好行駛,是非常困難的。唯一能夠徹底解決這件事就是靠AI,用類人的方法把路認好、把路選好,讓車開好。
李力耘:方向是篤定的,但我覺得技術(shù)變化會非常快。今年以來,我們也看到了類似于Sora、ChatGPT非常強的AI能力涌現(xiàn)。我們也升級了AI的戰(zhàn)略,包括對云端模型Scaling Law的認知,緊跟AI最前沿,然后應(yīng)用在自動駕駛領(lǐng)域。
李力耘:端到端模型的建立是個非常緩慢的過程。系統(tǒng)工作方式從原來多技術(shù)模塊變成AI中臺。我們會著重建設(shè)數(shù)據(jù)采集能力、數(shù)據(jù)清洗,模型快速訓(xùn)練、部署、調(diào)試,確保模型高效解決問題。
規(guī)則還是很重要的兜底能力,一方面是為安全兜底,第二,原來規(guī)則積累的工程基礎(chǔ),可以讓我們把整個數(shù)據(jù)閉環(huán)、飛輪非常高效地建立起來。
李力耘:重大轉(zhuǎn)折是今年四五月,小鵬一段式端到端大模型上線之后,我們發(fā)現(xiàn),原來需要花很長時間打磨的一些問題,比如花幾個月去打磨一些特殊的分流、右轉(zhuǎn)或者是掉頭等場景,解決得特別快,我們很驚訝。
原來的方案是小模塊AI驅(qū)動,然后做路徑規(guī)劃、速度規(guī)劃,整個鏈條非常長,遇到的問題很多。但我們用了AI能力后,環(huán)島掉頭、小路、很難的右轉(zhuǎn)場景都有很大的能力提升,效率比原來高很多。
李力耘:其實就是第一性原理。我們生活的交通環(huán)境,包括路牌、路標、紅綠燈,整個道路甚至車的造型都是為人來設(shè)計的,人最重要的傳感器是眼睛,所以純視覺一定是最直接、最高效的解決方案。特斯拉也分享過觀點,認為激光雷達+純視覺1+1并不大于或等于2,而是小于2。
小鵬的AI鷹眼視覺做到了比人的視覺更好的效果。在很多大光差、逆光的情況下會比人眼有更好的識別效果,這也是我們LOFIC架構(gòu)的特點。當(dāng)然我們也沒有放棄主動的傳感器,也會通過多模態(tài)跟毫米波雷達,超聲波雷達去做融合。
36氪汽車:在高速道路上或者一些特殊天氣,激光雷達還是有很好感知效果,小鵬純視覺有沒有解決這種特殊天氣場景下的方案?
李力耘:我恰恰覺得,這些情況下,第一性原理是更好的。再好的激光雷達在遠處的點云也是比較稀疏的。激光雷達不是完美的,在一些雨水天氣情況下它也有問題。小鵬AI 鷹眼視覺是通過更大算力,看得更清楚、更遠、反應(yīng)更快,車輛反應(yīng)速度提升了百分之四十幾,對場景做出很好的響應(yīng)。
李力耘:小鵬自研芯片的初衷就是實現(xiàn)軟硬件一體,最大效能地發(fā)揮軟件的威力。但更重要的是在云端模型的賦能下,我們會對芯片做針對性優(yōu)化,給用戶提供最好的體驗。
李力耘:2025年小鵬智駕轉(zhuǎn)折點會在年中,智駕能力會有更大飛躍,可能會從一段式端到端,跨越到全新的 AI 迭代模式。
李力耘:小鵬智駕真正的一號位和靈魂就是何小鵬。因為他篤定AI,篤定智能駕駛到自動駕駛,才有小鵬智駕的自我變革。他非常從用戶視角來看智駕,會去開智駕的中間過程版本和量產(chǎn)版本,感受變化,反饋問題。
所以對行業(yè)態(tài)勢的感知一定是多模態(tài)的,F(xiàn)在我們特別注重用戶反饋的NPS,智駕每個版本都會去做用戶調(diào)研。當(dāng)然也會和頂尖AI企業(yè)保持緊密接觸,包括去美國開車、取經(jīng)等,兼聽則明。
李力耘:不久前,我們把XOS 5.5.0 過程版也推給了他,他覺得我們又解決了30%-40%的問題。
36氪汽車:端到端方案依賴海量數(shù)據(jù),小鵬達成了2000萬clips的訓(xùn)練數(shù)據(jù),在這方面小鵬有沒有什么心得?
李力耘:得益于兩方面,一方面是AI智駕鐵軍,車端積累多年的規(guī)則和嚴謹算法,很多事情在車端做是事半功倍的。
另一方面,得益于小鵬AI的進展,我們需要大量、高效敏捷地去挖掘數(shù)據(jù),訓(xùn)練模型。所以我們既做車端模型、云端模型,也做了非常好的AI工具來挖掘數(shù)據(jù)。
這背后是組織方式的改變,我們有個AI效能部門,今年年中面向AI成立的新部門,專門訓(xùn)練各種各樣的AI提效工具,包括用AI寫代碼、檢查代碼、自動挖掘數(shù)據(jù)。
李力耘:我們大約在2022年底,就開始預(yù)研如何引入AI大模型,已經(jīng)有了幾年的積累。而且我們地把規(guī)則時代積累的經(jīng)驗移植到當(dāng)前的數(shù)據(jù)采集和訓(xùn)練里,例如通過車端規(guī)則經(jīng)驗實時標注,精準采集訓(xùn)練所需片段,從而針對目標場景進行精準密集訓(xùn)練,能夠大幅地提升采集和訓(xùn)練效率。
李力耘:如果把端到端技術(shù)趨勢看作智駕領(lǐng)域的一場“工業(yè)革命”,每一次工業(yè)革命中,真正實現(xiàn)轉(zhuǎn)型升級是少數(shù),大部分人還是面臨更殘酷的競爭。
端到端不是讓事情變得更簡單了,組織架構(gòu)的確跟原來不一樣,原來每個技術(shù)模塊都要基于規(guī)則的工程師,比如定感知、定位、規(guī)劃、融合、地圖、控制,現(xiàn)在就變成了數(shù)據(jù)閉環(huán)的問題。
數(shù)據(jù)采集、模型訓(xùn)練、模型部署,模型調(diào)試,它讓整個迭代鏈條變得更長,更加不可控,某種程度上需要投入更多的資源,包括更大算力,更加精英的AI的研究人員。
李力耘:第一,智駕真正從輔助駕駛走到無人駕駛一定是滿足第一性原理的。我更愿意相信是主機廠,而不是供應(yīng)商,能夠率先從輔助駕駛突破到無人駕駛。
第二,主機廠在軟硬件方面的配合、數(shù)據(jù)和中后臺的配合,可能是事半功倍;對非主機廠而言,可能更不容易,數(shù)據(jù)背后的閉環(huán)是更隱形的挑戰(zhàn)。
李力耘:現(xiàn)在智駕就像當(dāng)年的手機行業(yè),我們一定要把智駕價格打下來,未來的車型都會標配高階智駕。其實,智駕是小鵬P7+用戶購車的 top 理由。我們不會用智駕能力再做二次收費。
在小鵬X9 上,73%的車主都選擇了Max車型。我們也會持續(xù)關(guān)注用戶對智駕的反饋,比如他們喜歡的一些亮點或者不喜歡的槽點;在標配智駕后,我們會看用戶的滲透率,比如在能開智駕的地方,用戶是不是都開。
36氪汽車:市場上會有觀點說,小鵬現(xiàn)在車賣得好不是靠智駕,比如MONA M03。您會反駁這種觀點嗎?
李力耘:在MONA M03,智駕也起到了很重要的作用。同樣價位上,小鵬MONA M03 的智駕仍然領(lǐng)先,比如MONA M03率先推出斷頭路泊車,體驗上和主銷車型Max版泊車能力一樣。春節(jié)之后,MONA M03的 Max版本也會上AI鷹眼視覺方案,實現(xiàn)高階智駕的普惠跟平權(quán)。
李力耘:我們希望2025年,在擬人感、安全感、舒適和效率上,做到更不一樣的臺階和層次,與行業(yè)明顯拉開代際差距。
更重要的是,我們會用一段式端到端放大我們的車型優(yōu)勢,不僅標配所有車型,更希望覆蓋所有功能,實現(xiàn)點到點,包括賦能海外的智駕。
李力耘:對,小鵬非常堅定國際化,未來10年海外銷量要占全部銷量一半。2024年小鵬的出海非常不錯,但我覺得智駕還可以更好。明年,小鵬會根據(jù)海外當(dāng)?shù)氐鸟{駛習(xí)慣和法規(guī),把智駕體驗按照當(dāng)?shù)赜脩粝矚g的方向去做,提供給當(dāng)?shù)赜脩簟?/p>
李力耘:我們一直跟大眾配合很好,無論是在車型上,還是電子電氣架構(gòu)上,或者智駕上,雙方都是緊密合作。智駕會有專門的虛擬團隊和項目組去跟進,和大眾合作的車型會很快和大家見面。
李力耘:小鵬是非常篤定地把輔助駕駛推向極致,走向無人駕駛的。在AI輔助駕駛的理念下,我們會更看重像AI鷹眼視覺帶來的智能駕駛體驗平權(quán)。至于真正的商業(yè)化,可以關(guān)注小鵬在2026年無人駕駛的進展。
李力耘:我們一定會推進 L3 和 L4。哪個更快,這個取決于法規(guī)進展,我們一定緊跟著法規(guī)進展。在明年的Q1、Q2某個時候,隨著我們體驗和能力更進一步的提升,大家會看到更多可能。