理想八周年的時候,李想發(fā)了一封內(nèi)部信。但在九周年的時候,李想延續(xù)了自今年3月的沉默和低調,他沒有內(nèi)部講話,也沒有發(fā)內(nèi)部信,“他也就出來參與了內(nèi)部活動的抽獎。”一位員工說。
正因為如此,當李想在12月25日到27日,連續(xù)三天通過采訪形式談理想在智能駕駛、人工智能的進展和未來規(guī)劃,才會讓人覺得意外。
2022年11月,OpenAI的聊天機器人ChatGPT驚艷亮相。兩個月后,李想在內(nèi)部說“理想的愿景是成為一家全球領先的人工智能企業(yè)。”這看起來像一種跟風行為,但李想在2022年9月的時候就已經(jīng)確定把人工智能作為面向未來競爭的一個重要方向。
汽車是人工智能技術最好的落地場景之一,智能駕駛體驗對于用戶購車決策的影響越來越明顯,語音是智能座艙最高頻的交互方式?!?023年初發(fā)布的愿景,我們把人工智能從一個隱藏的戰(zhàn)略變成一個開放的陽謀的戰(zhàn)略,這樣我們才能吸引到足夠多的人才?!崩钕脒@樣解釋自己的人工智能發(fā)槍令。
重新回到鏡頭前,他宣告自己要從一家汽車公司CEO轉變?yōu)槿斯ぶ悄芷髽I(yè)CEO,因為理想做的不是汽車的智能化,而是人工智能的汽車化——正如之前所說,汽車是人工智能具象的最佳產(chǎn)品之一。李想還提出了一個新的概念——“硅基家人”。
“下半年看不到變化,你就別干了”
今年初,李想對理想汽車智能駕駛研發(fā)負責人郎咸朋說了一句話:“下半年如果我還看不到變化,我們還是拿不到(智能駕駛)頭部位置的話,你這個負責人就可以不用干了。”
早在2023年4月的上海車展上,理想汽車就喊出了城市NOA落地100城的目標,以應對來自華為和小鵬的競爭。但僅僅半年過后,這個目標就縮水為“在100城開通通勤NOA”。但兩者的實現(xiàn)難度都不小,基于Transformer的BEV算法加上Occupancy網(wǎng)絡,以及理想汽車和清華大學聯(lián)合研發(fā)的NPN神經(jīng)先驗網(wǎng)絡(Neural Prior Net)提供不了符合要求的可靠性和穩(wěn)定性,效率也很低。
今年初,李想逼著智駕團隊前往美國,在不同的城市駕駛特斯拉的車輛,體驗FSD V12.隨后,理想汽車轉向無圖NOA,但功能推送也延遲了3個月。
今年3月,理想MEGA和新款理想L7、8、9上市后的表現(xiàn)都沒有達到預期,理想汽車進行了一輪裁員,其中智能駕駛團隊屬于“重災區(qū)”。郎咸朋帶領的團隊一直在致力于用代碼解決“corner case(極端情況)”,今年上半年,他自己和團隊也遇到了職業(yè)生涯的corner case。
對于理想汽車來說,調減年度銷量目標、新車銷量不及預期、產(chǎn)品降價以及裁員,今年上半年都是壞消息。但從李想給郎咸朋撂下那句狠話之后——另外一句則是,李想和郎咸朋說“要么做端到端,要么別做自動駕駛了”,一些改變開始發(fā)生。
“我們統(tǒng)一了思路,還是回歸產(chǎn)品和用戶體驗上,而不是追求指標的領先?!崩上膛笳f,在李想撂下狠話之前,理想已經(jīng)開始在端到端的預研,那些話則是加快了研發(fā)的進程。
4月,理想將AD團隊中的200人帶到中關村進行封閉開發(fā),沖刺端到端技術的研發(fā)。半個多月后,5月初,郎咸朋就坐上了第一個端到端版本的測試車,測試路線是從中關村到北京交通大學,途經(jīng)包括中關村大街、三環(huán)的主輔路以及北京交通大學附近的狹小、無劃線道路等路段。
“縱向比之前試過的所有車的狀態(tài)都要好,剎車非常擬人舒適,這些問題在規(guī)則階段用很多代碼都沒有辦法解決。”郎咸朋很驚訝,因為僅僅用了15天時間就做到了這樣的水平。理想智駕算法研發(fā)部門負責人賈鵬對郎咸朋說:“一行規(guī)則都沒寫,全是系統(tǒng)按照給的數(shù)據(jù)訓練出來的?!?/p>
1個月后,郎咸朋讓李想試一下。在理想汽車北京研發(fā)中心,當時經(jīng)緯中國合伙人張穎也在,李想就讓他坐在主駕駛,自己坐在副駕駛。李想在試了之后對效果也感到驚訝,評價很高,“過去1個月的訓練比過去3年做的東西進步速度要更快?!?/p>
李想還舉了一個讓他印象深刻的場景,在一個路口,有一輛車為了躲避行人往測試車輛偏向,但這輛測試車學會了適時避讓,并且沒有生硬、頓挫的感覺。李想對張穎的解釋是“因為端到端的響應速度更快,不是規(guī)則時代的四個步驟了。
“李想說的all in智駕真的不是說說而已,他把智駕看得真的很重,也是真金白銀投入。”一位理想汽車的員工說。
去年9月的雁棲湖內(nèi)部戰(zhàn)略會后,李想聽從了美團CEO王興和Y Combinator中國創(chuàng)始人陸奇的建議,加大了云端訓練的投入,從字節(jié)跳動購買英偉達的服務器,還在外高價采購英偉達訓練卡,還先后與阿里云、百度云等云服務廠商開展合作。
今年初,理想的智算中心算力在半年時間里從2.4ELOPS翻倍增加至5EFLOPS,并會在今年底達到8EFLOPS。理想汽車每年在訓練算力的投入超過10億元?!拔覀兠磕?00億的研發(fā)投入,有一半是和人工智能相關的投入?!崩钕胝f。
但長遠投入更大,理想汽車認為,如果最終實現(xiàn)自動駕駛,需要的訓練算力要增加到100EFLOPS,折合成投入每年要超過10億美元。李想認為這些投入都是值得的。
他本人80%的時間都是用智駕在開車,另外20%是因為趕時間,需要駕駛效率,才不用智駕?!岸说蕉嗽隗w驗上最多可以做到L3的水平?!崩钕胝f。
“L3或者有監(jiān)督智能駕駛并不是L2的延續(xù),而是L4或者自動駕駛的先導程序。我們是錨著未來的自動駕駛能力去研發(fā)、去成長和迭代的,而不是沿著過去一套用L2的思路,去做現(xiàn)在的自動駕駛?!崩上膛笳f,這是理想在端到端上重金投入的主要原因之一。
另外,理想汽車發(fā)現(xiàn)優(yōu)秀的智能駕駛體驗的確對銷量有幫助。今年2月,理想的AD Max交付量占比只到20%左右,但在今年下半年超過50%了,這意味著理想汽車交付的是價格更高的車型。理想汽車希望能夠在2025年實現(xiàn)L3。
“現(xiàn)階段我們做的都是為了拿到L4的門票。電動化是拿智能化下半場的門票,為了實現(xiàn)L4,我們至少要有500萬輛車跑在路上,還要自己掌握 VLA(Vision Language Action Model,視覺語言行動模型)這個基礎模型的能力?!崩钕胝f。
今年10月14日,理想汽車第100萬輛整車在常州基地下線,此時距離第一輛下線整車過去了58個月。
“智能駕駛和理想同學,我都不會舍棄”
今年理想汽車在銷量上遇到一些挑戰(zhàn),今年前11個月,理想汽車累計交付了44.2萬輛車,按照理想汽車的銷售能力樂觀估計,今年的交付量最多能達到50萬輛,只有年初目標的大約62.5%。
盡管如此,理想汽車的銷量在造車新勢力中仍然處于領先地位,這確保了他們擁有健康的現(xiàn)金流。今年第三季度,理想汽車的凈利潤達到28億元,經(jīng)營性現(xiàn)金流為110億元,現(xiàn)金儲備1065億元。
健康的財務狀況是理想在研發(fā)投入上的首要條件。即使不這樣,李想仍然不會舍棄在人工智能上的投入?!百Y源有限的話,智能駕駛和理想同學我也不會二選一,我會削減其他的投入。”李想說。
OpenAI的ChatGPT剛發(fā)布的時候,李想就用了,他的第一感覺是“這才是人工智能應該有的樣子”。
理想汽車智能空間AI負責人陳偉也同樣大受震撼,其中一個原因是大模型帶來的認知智能和語言智能上突飛猛進的變化,再者他們也在反思,為什么沒有快速把模型架做高做大。李想對陳偉和他的團隊提出,要回歸用戶體驗,從核心問題——認知智能開始解決。
因為他們的判斷是,除了OpenAI,絕大部分的團隊技術水平都處于早期階段,在邊界還不清晰的情況下,要把握住第一性原理規(guī)模效應。于是,李想和陳偉決定要做基座模型,從底層開始建設,以保證未來的技術擴容能力,應對產(chǎn)品迭代需求。
2023年4月,Mind GPT 1.0的第一版模型完成。2023年年底,理想汽車推送了OTA 5.0,大模型上車。今年年中,理想的Mind GPT 迭代到了2.0。今年底,理想就會上線Mind GPT 3.0。相比較前兩代,Mind GPT 3.0的重點是語言模型,人機交互的延遲更低,交互更擬人。
面向未來,Mind GPT 的模型架構采用的是MoE(混合專家模型)和Transformer結合,持續(xù)往前迭代。“我們是希望能夠實現(xiàn)從L1 ChatBot(聊天機器人)到L2(推理者)的變化。在L1,它能實現(xiàn)多模態(tài),擁有指令遵循的能力。當理想同學走到L3的時候,Mind GPT 應該是一個多模態(tài)智能體?!标悅フf。
李想把“智能體”稱之為“iPhone 4時刻”——普通老百姓都能用,能獨立、連續(xù)、持續(xù)的完成任務,而不再需要密集的提示詞。
12月27日,理想同學的應用程序正式在手機端上線,這也是第一家把智能座艙的語音助手做成手機應用程序的汽車公司。就功能和使用而言,理想同學就類似于字節(jié)跳動的豆包、百度的文心一言。使用場景的擴展,會給理想的語言大模型迭代提供更多樣化的數(shù)據(jù)。
“不做人工智能,我們什么也不是”
李想說,如果不能實現(xiàn)L4自動駕駛,理想很難邁入萬億俱樂部的行列。陳偉則更加直接:“我們要是在未來不做人工智能,我們什么都不是?!?/p>
智能駕駛和理想同學,按照定義其實屬于人工智能的兩個應用。但在李想看來,兩者一定能夠產(chǎn)生連接,關鍵在于基座模型進化為VLA。因為語言模型和智能駕駛一樣,都是通過語言和認知理解三維世界,用擴散模型和生成的方式來還原真實的物理世界。
李想認為,AGI(通用人工智能)有三個階段。第一個階段是“增強我的能力”,也就是輔助階段,L3也處于這個階段;第二個階段是“成為我的助手“,意味著人工智能可以完成任務并承擔結果,比如L4;AGI的終極階段就是“硅基家人”,人工智能成為家庭的一員,或者一位可信賴的朋友,不需要任何指示,對所有相關成員都有深入了解。
對應來看,理想也正在分三步走,首先是在中國市場爭取成為第一,然后考慮在受美國限制以外的市場做到第一;2025年,理想的目標是要在中國成為智能駕駛的第一,在語言智能、大語言模型以及所提供的服務方面進入到前三;再往后,要把語言模型和智能駕駛合成一個更大的VLA模型,全面進入智能體階段,也具備L4的能力。
在未來,理想還會做具身機器人,或者在2030年的時候推出一輛具備人工智能能力的超級跑車——這個想法可能在李想下單購買法拉利296的時候就已經(jīng)出現(xiàn),但未來的主導者可能并不一定是李想本人。
他同樣喜歡把企業(yè)的發(fā)展分為三個階段。在0-1的階段,他是主導,是團隊的天花板;但在1-10的階段,他可能就是瓶頸了,所以理想正在建立一個培養(yǎng)人才的體系,確保每個做產(chǎn)品的人都要比三四年前的李想更好。而在走向100分的階段,可能就會是年輕人在主導。
2024年,理想迎來了3000人的校招新成員,在李想的眼里,這些人比他們那一代人優(yōu)秀10倍以上,受到了最好的教育,心智成熟,更重要的是他們已經(jīng)拿出了結果。理想的技術展示會上AI相關產(chǎn)品有一半以上都是校招團隊做出來的,這令他非常驚訝。
“我們常說一個時代已經(jīng)過去了,但我在他們身上看到一個時代已經(jīng)開始了?!崩钕胝f。
不會像特斯拉一樣做Robotaxi!李想“回歸”談人工智能三個階段,還解釋了為什么買法拉利
“中國被公認處于世界領先地位”,普京指示俄方與中國合作推動人工智能進一步發(fā)展
大童保險服務蔣銘:以科技創(chuàng)新賦能保險服務 積極擁抱數(shù)字化轉型和人工智能
四大預測!華爾街如何看待明年人工智能行業(yè)發(fā)展和機遇
華為:全球首個海拔 5000 米高原露天礦無人駕駛成果發(fā)布
三部門印發(fā)衛(wèi)生健康行業(yè)人工智能應用場景參考指引
高速銅連接板塊爆發(fā),博創(chuàng)科技20CM漲停!創(chuàng)業(yè)板人工智能ETF華寶(159363)反彈超2%,近兩日吸金超9000萬元
還沒有評論,來說兩句吧...