D

Drivelmmo1

由ayeshaishaq開發
DriveLMM-o1是專為自動駕駛優化的微調大型多模態模型,基於InternVL2.5-8B架構並通過LoRA技術進行適配,利用拼接的多視角圖像實現逐步推理。
下載量 233
發布時間 : 3/11/2025

模型概述

DriveLMM-o1是一個面向自動駕駛推理的大型多模態模型,通過整合多視角圖像實現全景場景理解,並生成詳細的中間推理步驟解釋決策過程。

模型特點

多模態融合
整合多視角圖像實現全景場景理解
鏈式推理
生成詳細的中間推理步驟解釋決策過程
高效適配
採用動態圖像分塊和LoRA微調技術,以極少的額外參數處理高分辨率輸入
性能突破
相比現有開源模型,在最終答案准確率和整體推理評分上取得顯著提升

模型能力

多視角圖像處理
自動駕駛決策推理
場景感知與物體理解
風險評估
交通規則遵守分析

使用案例

自動駕駛
風險評估
通過多視角圖像分析駕駛環境中的潛在風險
風險評估準確率達到73.01%
交通規則遵守
分析駕駛行為是否符合交通規則
交通規則遵守率達到81.56%
場景感知與物體理解
識別和理解駕駛環境中的各種物體和場景
場景感知與物體理解準確率達到75.39%
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase