1. <th id="1kj5t"><video id="1kj5t"><acronym id="1kj5t"></acronym></video></th>
    1. <big id="1kj5t"><em id="1kj5t"></em></big>
      <center id="1kj5t"></center>

      • IIANews微官網
        掃描二維碼 進入微官網
        IIANews微信
        掃描二維碼 關注微信
        移動客戶端
      • English
      工業連接和智能傳感論壇
      工業機器人

      不看算力看效率,更高級別的自動駕駛需要多少 “FPS”?

        2021年04月02日  

        特斯拉Hardware3.0的效率之謎

        特斯拉在其推出的Hardware3.0自動駕駛平臺中,采用自研芯片替代了NvidiaDrivePX2,其理論算力直線提升了12倍,而以MAPS方式來評估,其真實AI性能更是驚人的提升了21倍。具體而言,Hardware2.0時每秒只能處理110幀圖像,而現在則高達2300幀。

        那么,Hardware的效率提升應該如何認識呢?在“算力至上”的今天,如何透過數字直剖本質評估AI芯片的真實性能?

      算力攀升,為什么卻看不到實用性?

        隨著芯片制程技術的演進,摩爾定律的發展卻逐漸進入瓶頸期,這與當下計算 AI 計算需求量爆發式的增長顯得格格不入。追求純算力突破并不可持續,同時算力也并不代表汽車智能芯片“真實性能”,芯片計算效率也同樣需要關注。于是,軟硬結合、算法加持的 AI 芯片接過了跑贏新場景的接力棒。

        當前,行業普遍以“TOPS”為單位來評估AI的理論峰值算力。盡管在目前主流的AI芯片性能基準測試( MLPerf )下很多頂級廠商頻繁刷新榜單記錄,但在實際場景下的算力有效利用率卻差強人意。

        人們逐漸認識到,AI芯片理論峰值算力并不一定能在實際運行中完全釋放。例如,一款擁有理論峰值算力為16TOPS的芯片,在計算不同模型時甚至會有接近80%的差異。此外,在卷積神經網絡任務實測中,從2014年到2019年,最好的神經網絡計算效率相差了100倍,相當于計算效率每9個月翻一倍,遠快于每18個月翻倍的摩爾定律。因此在模型算法演進速度遠快于芯片性能提升的速度的現在,不僅需要算力更高的芯片,也需要更合理的性能評估方法幫助用戶選擇適合的AI芯片。

        對這些AI時代出現的新變化,以地平線為代表的AI芯片企業認為,單純依賴于 PPA 芯片設計指標,很容易陷入算力至上的“誤區”,但算力并不是完全反應芯片性能唯一評估標準。因此,地平線提出了 MAPS(Mean Accuracy-guaranteed Processing Speed)概念和評估方法,以此作為檢驗AI性能的真正標準。通俗來說,就是在特定的 AI 應用領域,看芯片處理 AI 任務的速度和精度,即“多快”和“多準”。

      MAPS 動態評估芯片真實 AI 性能

        隨著 AI 算法的不斷演進,幾乎每 10-14 個月,相同的計算精度計算量可以下降一半。這種提升與算法設計的精妙程度息息相關,但算法的快速演進也對計算架構提出巨大的挑戰,尤其是對傳統通用的并行架構而言,例如亟需高效AI專用處理器的自動駕駛場景。

        MAPS 其實是在物理算力的基礎上,通過對大量模型的測試,綜合各個模型的速度(正比與物理算力*實際利用率)和準確率得到的最佳方案的量化結果。它更聚焦于使用戶能夠通過可視化的圖表直觀的感知 AI 芯片真實算力。正如對于汽車來說,馬力(單位: HP)不如百公里加速時間(單位:秒)更真實反映整車動力性能;算力(單位: TOPS)并不反映汽車智能芯片實際性能,而每秒準確識別幀率 MAPS(單位: FPS)才是更真實的性能指標。

      MAPS=最佳模型多邊形面積/(精度上界—精度下界),其中橫軸反應幀率,縱軸反應精度

        此外,在自動駕駛中應該如何對速度和精度做取舍呢?現實生活中我們經常遇到一些極端的案例,例如當汽車遭遇小孩子橫穿馬路的突發狀況時,如果自動駕駛識別延時過高,會剎車不及時;如果精度不夠,則會造成無法識別。在很多類似的場景中,我們往往面臨既要“快”,又要兼顧“準”的境況。而在 MAPS 評估方法下,我們可以清晰看到幀率和精度之間的動態關系,這也是其對實際場景的重要價值之一。

      更高級別自動駕駛需要多少“FPS”?

        軟件定義的汽車的趨勢下,未來汽車正逐步成為四個輪子上的超級計算機??梢郧逦A見的是,電動車賣點不是車,而是「智能」,這是一個堪比計算機誕生級別的創新。

        特斯拉在 Hardware 3.0 中,采用其自研 AI 芯片 FSD Chip 替代了 Hardware 2.5 中的 Nvidia Drive PX2,算力從 12 TOPS 提升到了 144 TOPS,但運行同樣模型的精度卻驚人的提升了 21 倍。具體而言,Hardware 2.0 時每秒只能處理 110 幀圖像,而現在則高達 2300 幀。除了絕對算力的提升,額外提升則來自于利用率的提升。同時特斯拉也宣布針對 Hardware 3.0 重寫自動駕駛軟件,從而在 2020 年 10 月推出了 FSD beta,這是唯一不受場地限制、大規模測試的自動駕駛方案。

        特斯拉革命性技術的重構與 MAPS 背后體現的理念有相通之處:提升物理算力(HW 3.0 提升 12 倍)、提升利用率(提升近 2 倍),找到最佳的速度和準確率提升(重寫自動駕駛軟件),使得特斯拉從簡單場景的 NOA 一步步突破到不受限的自動駕駛。而地平線在芯片設計之中一直貫徹 MAPS 背后的技術理念,關注提升物理算力的同時關注利用率的提升,并且不斷把算法發展趨勢,使得軟硬件可以協同共振,發揮最高效能。

        為了助力汽車廠商突破“特斯拉困境”,實現高級別自動駕駛的落地。地平線即將推出的征程 5 MAPS 整體跑分高達 3020 FPS,其中 MAPS@COCO (檢測任務COCO MAPS) 跑分可高達 116,而 Nvidia Xavier MAPS@COCO 為 41 FPS (GPU&DLA@32W mode ),如此高的性能將助力車廠加速實現自動駕駛方案的落地。

        驅動新基建數字底座,需要有算力也要有效率。自成立以來,地平線便致力于兼備算力與效率的高性能芯片。未來,地平線將推出性能更強大的征程6,其不僅在功耗、面積優化的基礎上,同時在MAPS上繼續提升一個數量級,助力全行業共同努力進一步大幅提升自動駕駛的安全性。

      標簽:地平線 HorizonRobotics我要反饋
      最新視頻
      ABB《建筑是凝固的音樂》第五集,盡顯中世紀古船之美   
      三法蘭穿墻接插件   
      世強
      福祿克
      施耐德電氣EcoStruxure開發自動化平臺,軟硬件解耦,釋放工業潛能
      專題報道
      2020中國智能制造發展論壇
      2020中國智能制造發展論壇 12月2日,“2020中國智能制造發展論壇”在廣東現代國際展覽中心盛大召開。在這場年度盛會中,來自東莞市政府領導與制造業行業的多位大咖聚焦華南地區的工業基礎和轉型特點,通過豐富的應用案例進行分享與討論,為中國的智能制造產業發展提供了方向。
      企業通訊
      2021 ABB電氣云學堂
      2021 ABB電氣云學堂

      2020年,ABB電氣云學堂為廣大觀眾帶來滿滿干貨知識,通過一系列智能化解決方案滿足不同行業所需。2021年,ABB電氣

      專于機械,告別“凡學”——魏德米勒緊湊型重載連接器
      專于機械,告別“凡學”——魏德米勒緊湊型重載連接器

      化繁為簡!緊湊型重載是魏德米勒基于對機械市場的深刻理解,針對機械客戶核心需求,厚積薄發,精心設計的一款專利性創新產品。

      在線會議

      社區

      无限在线观看免费视频-中文字幕巨大的乳专区不卡顿-欧美乱妇欲仙欲死视频-黑人与中国女一级毛片
      1. <th id="1kj5t"><video id="1kj5t"><acronym id="1kj5t"></acronym></video></th>
        1. <big id="1kj5t"><em id="1kj5t"></em></big>
          <center id="1kj5t"></center>