CVPR全名是Conference on Computer Vision and Pattern Recognition(國際電腦視覺與圖型識別會議),初期原本只是視覺辨識為主題,近幾年演變成為重要的自動駕駛業界的技術發表與研討會議。comma ai將會參加今年2025 CVPR 6/11-6/15的研討活動,與Waymo、Wayve、Mobileye自駕領域等等工作團隊齊聚,發表MLSIM與他們的研究論文Learning to Drive from a World Model。
comma ai是一個特異獨行的公司,硬體自己做、資料中心自己建、連風冷系統都DIY。他們不只是節儉,更是工程實力與成本意識的結合。他們不靠砸錢買廣告,從手機+3D列印到客製化主機,然後又淘汰SNPE撰寫自己的tinygrad,也沒有噴錢拚GPU衝算力,用算力暴力解人工智慧,反而做出自己的訓練伺服器tinybox與tinybox Pro,除了自用,還能賣算力給別人,讓公司有營收、有獲利——這在當今ai圈,幾乎是傳奇。
MLSIM的誕生,代表自駕訓練正式邁入模擬時代。傳統做法是靠實車數據訓練模型,但多數上傳影像經常過於單調。為了讓ai能處理更多複雜性,comma.ai開始用模擬世界「生成」出路口轉彎、偏離、撞擊、逼車等真實場景,再讓模型在其中學習與修正。
簡單解釋MLSIM,它將影像與車輛動態姿態(POSE)結合,透過transformer模型理解「車子怎麼動,畫面如何變動」,然後進一步「生出」場景。這比傳統幾何偏移畫面來得更多元與複雜,也更貼近實務需求,最大的好處是,由於不用上路,所以大幅降低駕駛模型的訓練成本。
comma.ai的行車資料庫,已累積超過一億英里的上傳里程,全球僅次於特斯拉。自駕的engaged使用率達到58%,代表使用者行駛過半的距離由ai操控。
跟我們相關的是,台灣使用者眾多,除了原廠的資料,還有更多山寨硬體的使用者。從北到南,都有openpilot的軌跡遍佈。
comma.ai靠販售硬體與算力,就能自給自足,還能持續投資前沿技術。這家公司技術一直緊咬在不輸特斯拉一年到兩年的狀態,而且它的後裝市場無人能敵。我曾經形容它像蟑螂般頑強,對於眾多自動駕駛的大公司來說,是個相當難纏的小公司。
如今,他們不只擁有技術以及資料優勢,現在更打破自駕ai訓練的傳統框架。GeorgeHotz從車庫出發,很值得我們來看看它們能爬多高走多遠,未來或許——comma.ai的故事,不只是技術傳奇,更是一家從美國創業、美國製造又賺得到錢的ai公司的活教材。
======工商業配時間======
O3是3代機種,C3X是3.5代,兩者共用模型。
O3是三鏡頭、64GB、canbus
C3X是三鏡頭、128GB、canbus+canfd
兩者目前用一樣的模型,可以安裝一樣的版本與分支。
你不需要思考自己要裝O3還是C3X,其實你要思考的是你的車子需要一套openpilot。只要你的車是支援車款,都可以不用換車升級你的ADAS,為你的旅程帶來更多的舒適和便利。comma ai的openpilot是真實的ai產品,而且他們在E2E自動駕駛技術領域的領先地位以及不斷創新。讓我們期待未來升級ai模型可以帶來更多的驚喜,一起見證ai科技對我們生活的改變。