亚洲一区激情国产日韩,色综合久久六月婷婷中文字幕,久久国产精品二国产精品,免费永久国产在线视频

          • 資訊
          • 報(bào)告
          當(dāng)前位置:中研網(wǎng) > 結(jié)果頁(yè)

          算法:“BEV+Transformer”引領(lǐng)自動(dòng)駕駛感知范式

          • 陳博 2023年10月31日 來(lái)源:中研網(wǎng) 1014 64
          • 繁體

          BEV全稱Bird'sEyeView,即鳥(niǎo)瞰圖,該算法旨在將多傳感器收集的圖像信息投射至統(tǒng)一3D空間,再輸入至單一大模型進(jìn)行整體推理。相較于傳統(tǒng)的攝像頭圖像,BEV提供了一個(gè)更貼近實(shí)際物理世界的統(tǒng)一空間,為后續(xù)的多傳感器融合以及規(guī)劃控制模塊開(kāi)發(fā)提供了更大的便利和更多的可B


          大模型是當(dāng)前AI領(lǐng)域最為火熱的前沿趨勢(shì)之一,可賦能自動(dòng)駕駛領(lǐng)域的感知、標(biāo)注、仿真訓(xùn)練等多個(gè)核心環(huán)節(jié)。在感知層,以特斯拉為首,"BEV+Transformer"范式已開(kāi)始在自動(dòng)駕駛領(lǐng)域得到廣泛使用,可有效提升感知精確度,利于后續(xù)規(guī)劃控制算法的實(shí)施,促進(jìn)端到端自動(dòng)駕駛框架的發(fā)展。

          BEV全稱Bird'sEyeView,即鳥(niǎo)瞰圖,該算法旨在將多傳感器收集的圖像信息投射至統(tǒng)一3D空間,再輸入至單一大模型進(jìn)行整體推理。相較于傳統(tǒng)的攝像頭圖像,BEV提供了一個(gè)更貼近實(shí)際物理世界的統(tǒng)一空間,為后續(xù)的多傳感器融合以及規(guī)劃控制模塊開(kāi)發(fā)提供了更大的便利和更多的可能。具體來(lái)說(shuō),BEV感知的優(yōu)勢(shì)在于:1)統(tǒng)一了多模態(tài)數(shù)據(jù)處理維度,將多個(gè)攝像頭或雷達(dá)數(shù)據(jù)轉(zhuǎn)換至3D視角,再做目標(biāo)檢測(cè)與分割等任務(wù),從而降低感知誤差,并為下游預(yù)測(cè)和規(guī)劃控制模塊提供更豐富的輸出;2)實(shí)現(xiàn)時(shí)序信息融合,BEV下的3D視角相較于2D信息可有效減少尺度和遮擋問(wèn)題,甚至可通過(guò)先驗(yàn)知識(shí)"腦補(bǔ)"被遮擋的物體,有效提高自動(dòng)駕駛安全性;3)感知和預(yù)測(cè)可在統(tǒng)一3D空間中實(shí)施,通過(guò)神經(jīng)網(wǎng)絡(luò)直接完成端到端優(yōu)化,可有效降低傳統(tǒng)感知任務(wù)中感知與預(yù)測(cè)串行的誤差累積。

          Transformer的注意力(Attention)機(jī)制可幫助實(shí)現(xiàn)2D圖像數(shù)據(jù)至3DBEV空間的轉(zhuǎn)化。Transformer是GoogleBrian團(tuán)隊(duì)在2017年提出的神經(jīng)網(wǎng)絡(luò)模型,起初用于機(jī)器翻譯,隨著技術(shù)的發(fā)展開(kāi)始進(jìn)軍圖像視覺(jué)領(lǐng)域,目前已成功涉足分類、檢測(cè)和分割三大圖像問(wèn)題。據(jù)汽車(chē)之心微信公眾號(hào)介紹,傳統(tǒng)CNN模型的原理是通過(guò)卷積層構(gòu)造廣義過(guò)濾器,從而對(duì)圖像中的元素進(jìn)行不斷地篩選壓縮,因此其感受域一定程度上取決于過(guò)濾器的大小和卷積層的數(shù)量。隨著訓(xùn)練數(shù)據(jù)量的增長(zhǎng),CNN模型的收益會(huì)呈現(xiàn)過(guò)飽和趨勢(shì)。而Transformer的網(wǎng)絡(luò)結(jié)構(gòu)在嫁接2D圖像和3D空間時(shí)借鑒了人腦的注意力(Attention)機(jī)制,在處理大量信息時(shí)能夠只選擇處理關(guān)鍵信息,以提升神經(jīng)網(wǎng)絡(luò)的效率,因此Transformer的飽和區(qū)間很大,更適宜于大規(guī)模數(shù)據(jù)訓(xùn)練的需求。在自動(dòng)駕駛領(lǐng)域,Transformer相比于傳統(tǒng)CNN,具備更強(qiáng)的序列建模能力和全局信息感知能力,目前已廣泛用于視覺(jué)2D圖像數(shù)據(jù)至3D空間的轉(zhuǎn)化。

          除感知層外,大模型還有望顯著提升后端訓(xùn)練中數(shù)據(jù)清洗標(biāo)注的效率,并助力生成新場(chǎng)景以賦能仿真訓(xùn)練。訓(xùn)練模型在收集到傳感器傳送回的圖像數(shù)據(jù)后,需先對(duì)數(shù)據(jù)進(jìn)行清洗,再對(duì)其中的車(chē)輛、行人、道路標(biāo)識(shí)、車(chē)道線等元素進(jìn)行標(biāo)注。相較于此前的人工標(biāo)注,大模型可以大幅提升工作效率。理想汽車(chē)創(chuàng)始人李想在中國(guó)電動(dòng)汽車(chē)百人會(huì)論壇(2023)的演講中表示,此前理想一年要做大概1000萬(wàn)幀自動(dòng)駕駛圖像的人工標(biāo)定,年成本接近1億元,但使用軟件2.0大模型進(jìn)行自動(dòng)化標(biāo)定后,效率是人的1000倍。毫末智行也2023年4月第八屆AIDAY上表示,其最新推出的DriveGPT可將交通場(chǎng)景圖像的標(biāo)注費(fèi)用從行業(yè)平均約5元/張降至約0.5元/張。Meta最新的圖像分割模型SAM(SegmentAnythingModel)在對(duì)圖像和視頻中的物體進(jìn)行識(shí)別分割時(shí)展現(xiàn)出了強(qiáng)大的能力,且具有零樣本性能,即能夠?qū)奈从?xùn)練過(guò)的圖片進(jìn)行精準(zhǔn)分割,未來(lái)也有望賦能自動(dòng)駕駛訓(xùn)練所需的圖像數(shù)據(jù)積累。

          在"BEV+Transformer"趨勢(shì)下,算法復(fù)雜度、數(shù)據(jù)規(guī)模以及模型參數(shù)均呈指數(shù)級(jí)提升,推動(dòng)自動(dòng)駕駛芯片向著大算力、新架構(gòu)以及存算一體等方向演進(jìn)。

          1、大算力:

          向數(shù)百TOPS算力演進(jìn)。傳統(tǒng)L1/L2輔助駕駛所需處理的數(shù)據(jù)量小且算法模型相對(duì)簡(jiǎn)單,因此以Mobileye為代表的單目視覺(jué)+芯片算法強(qiáng)耦合的一體機(jī)方案即可滿足需求。但領(lǐng)航功能作為高階輔助駕駛的代表,需要"更強(qiáng)算力+軟硬件解耦的芯片+域控制器"來(lái)滿足海量數(shù)據(jù)處理與后續(xù)持續(xù)OTA迭代的需求。高速領(lǐng)航開(kāi)始向20萬(wàn)以下車(chē)型滲透,15-30TOPS可滿足基本需求,但若想要"好用"或需要30-80TOPS。城區(qū)領(lǐng)航的場(chǎng)景復(fù)雜程度和技術(shù)實(shí)現(xiàn)難度更高,目前普遍需要搭載激光雷達(dá),芯片以英偉達(dá)Orin、華為MDC和地平線J5為主,算力配置普遍超200TOPS。而在應(yīng)用"BEV+Transformer"技術(shù)后,多傳感器前融合以及2D至3D空間的轉(zhuǎn)化需要AI芯片具備更強(qiáng)的推理能力,因此也需要比以往更大的算力支撐,包括更高的AI算力、CPU算力和GPU算力。

          2、新架構(gòu):

          加強(qiáng)并行計(jì)算能力和浮點(diǎn)運(yùn)算能力。相較于CNN/RNN,Transformer具有更強(qiáng)的并行計(jì)算能力,可加入時(shí)間序列矢量,其數(shù)據(jù)流特征有顯著差別,浮點(diǎn)矢量矩陣乘法累加運(yùn)算更適合采用BF16精度。Transformer允許數(shù)據(jù)以并行的形式進(jìn)行計(jì)算,且保留了數(shù)據(jù)的全局視角,而CNN/RNN的數(shù)據(jù)流只能以串行方式計(jì)算,不具備數(shù)據(jù)的全局記憶能力。傳統(tǒng)AI推理專用芯片大多針對(duì)CNN/RNN,并行計(jì)算表現(xiàn)不佳,且普遍針對(duì)INT8精度,幾乎不考慮浮點(diǎn)運(yùn)算。因此想要更好適配Transformer算法,就需要將AI推理芯片從硬件層面進(jìn)行完整的架構(gòu)革新,加入專門(mén)針對(duì)Transformer的加速器,或使用更強(qiáng)的CPU算力來(lái)對(duì)數(shù)據(jù)整形,這對(duì)芯片架構(gòu)、ASIC研發(fā)能力,以及成本控制都提出了更高的要求。以特斯拉、地平線為代表的廠商均"重ASIC(即AI推理專用芯片),輕GPU"。特斯拉引領(lǐng)BEV+Transformer路線,以專用NPU(神經(jīng)網(wǎng)絡(luò)處理器)承擔(dān)AI運(yùn)算,在NPU設(shè)計(jì)之初便進(jìn)行了針對(duì)性優(yōu)化。而地平線等后來(lái)者或需要在下一代芯片中對(duì)AI推理芯片架構(gòu)進(jìn)行針對(duì)性優(yōu)化。

          3、存算一體:

          SoC芯片需配置高帶寬存儲(chǔ)器(HBM)或SRAM,并加速向存算一體靠攏,解決大算力下的數(shù)據(jù)吞吐量瓶頸。模型越大,內(nèi)存對(duì)AI加速器就越重要,以頻繁地讀取權(quán)重矩陣或訓(xùn)練好的模型參數(shù)。據(jù)佐思汽研介紹,Transformer中的權(quán)重模型超過(guò)1GB,對(duì)比傳統(tǒng)CNN的權(quán)重模型通常不超過(guò)20MB。模型參數(shù)越大,就需要更高的帶寬,一次性讀出更多參數(shù)。存算一體可分為近存計(jì)算(PNM)、存內(nèi)處理(PIM)以及存內(nèi)計(jì)算(CIM),存內(nèi)計(jì)算則接近存算一體,當(dāng)前PNM已廣泛用于高性能芯片,即采用HBM堆疊,2.5D封裝,從而與CPU集成,而PIM和CIM仍處在發(fā)展中。以特斯拉FSDSoC為例,其采用總帶寬為68GB/s的8顆LPDDR4內(nèi)存,而集成在NPU中的SRAM可達(dá)到32MBL3緩存,帶寬達(dá)2TB/s,遠(yuǎn)超市面上同類芯片。而據(jù)汽車(chē)之心微信公眾號(hào),特斯拉在最新HW4.0上的二代FSDSoC上使用了16顆GDDR6,在內(nèi)存用料上繼續(xù)引領(lǐng)行業(yè)。

          欲了解更多中國(guó)智能駕駛行業(yè)的未來(lái)發(fā)展前景,可以點(diǎn)擊查看中研普華產(chǎn)業(yè)院研究報(bào)告2023-2028年中國(guó)智能駕駛行業(yè)市場(chǎng)深度全景調(diào)研及投資前景分析報(bào)告》。


          中研網(wǎng)公眾號(hào)

          關(guān)注公眾號(hào)

          免費(fèi)獲取更多報(bào)告節(jié)選

          免費(fèi)咨詢行業(yè)專家

          延伸閱讀

          推薦閱讀

          算力市場(chǎng)研究報(bào)告分析:我國(guó)算力產(chǎn)業(yè)的發(fā)展情況

          我國(guó)算力產(chǎn)業(yè)的發(fā)展情況近期,工業(yè)和信息化部聯(lián)合有關(guān)部門(mén)印發(fā)了《算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展行動(dòng)計(jì)劃》,大家都很關(guān)注,...

          2023消費(fèi)電子行業(yè)發(fā)展分析 消費(fèi)電子產(chǎn)業(yè)鏈業(yè)績(jī)逐季改善

          消費(fèi)電子一般指消費(fèi)電子產(chǎn)品,是指圍繞著消費(fèi)者應(yīng)用而設(shè)計(jì)的與生活、工作娛樂(lè)息息相關(guān)的電子類產(chǎn)品,最終實(shí)現(xiàn)消費(fèi)者自...

          中老年鞋行業(yè)市場(chǎng)現(xiàn)狀及未來(lái)前景預(yù)測(cè)分析

          作為鞋類市場(chǎng)近些年興起的一個(gè)細(xì)分領(lǐng)域,老人鞋一直呈快速發(fā)展態(tài)勢(shì)。老人鞋,也叫老年鞋,是近些年鞋類市場(chǎng)上興起的一...

          2023造船行業(yè)發(fā)展?fàn)顩r:三季度中國(guó)造船產(chǎn)能利用監(jiān)測(cè)指數(shù)同比增長(zhǎng)超兩成

          船舶工業(yè)是現(xiàn)代綜合性產(chǎn)業(yè),也是軍民結(jié)合的戰(zhàn)略性產(chǎn)業(yè),能夠?yàn)楹Q箝_(kāi)發(fā)、水上交通運(yùn)輸、能源運(yùn)輸、國(guó)防建設(shè)等提供必要...

          我國(guó)期貨行業(yè)的發(fā)展態(tài)勢(shì) 國(guó)內(nèi)150家期貨公司總資產(chǎn)1.7萬(wàn)億元

          中國(guó)期貨業(yè)協(xié)會(huì)最新數(shù)據(jù)顯示,5月全國(guó)期貨市場(chǎng)成交量為8.25億手,成交額為50.37萬(wàn)億元,同比分別增長(zhǎng)75.16%和25.60%...

          中國(guó)集裝箱租賃行業(yè)市場(chǎng)分析:總體租箱需求將持續(xù)增長(zhǎng)

          集裝箱租賃是指集裝箱租賃公司與承租人,一般為海運(yùn)班輪公司,鐵路、公路運(yùn)輸公司等,簽訂協(xié)議,用長(zhǎng)期或短期的方式把...

          猜您喜歡

          【版權(quán)及免責(zé)聲明】凡注明"轉(zhuǎn)載來(lái)源"的作品,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多的信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)。中研網(wǎng)倡導(dǎo)尊重與保護(hù)知識(shí)產(chǎn)權(quán),如發(fā)現(xiàn)本站文章存在內(nèi)容、版權(quán)或其它問(wèn)題,煩請(qǐng)聯(lián)系。聯(lián)系方式:jsb@chinairn.com、0755-23619058,我們將及時(shí)溝通與處理。
          • 資訊
          • 報(bào)告

          中研普華集團(tuán)聯(lián)系方式廣告服務(wù)版權(quán)聲明誠(chéng)聘英才企業(yè)客戶意見(jiàn)反饋報(bào)告索引網(wǎng)站地圖 Copyright ? 1998-2023 ChinaIRN.COM All Rights Reserved.    版權(quán)所有 中國(guó)行業(yè)研究網(wǎng)(簡(jiǎn)稱“中研網(wǎng)”)    粵ICP備05036522號(hào)

          研究報(bào)告

          中研網(wǎng)微信訂閱號(hào)微信掃一掃