nora-long開源視覺-語言-動作模型 - 憑語言指令與圖像生成機器人動作

Home

Nora Long

Developed by declare-lab

基於開放X具身數據集訓練的視覺-語言-動作模型，以語言指令和攝像頭圖像為輸入生成機器人動作

多模態融合

Transformers

#機器人動作生成 #視覺-語言-動作模型 #5步動作跨度

Downloads 673

Release Time : 4/29/2025

Model Overview

諾拉長程版是基於通義千問2.5 VL-3B模型微調的開源視覺-語言-動作模型，專為機器人操作任務設計，採用5步動作跨度進行預訓練，在LIBERO仿真環境中表現優異

Model Features

長程動作預測

採用5步動作跨度預訓練，適合需要長程規劃的任務場景

多模態輸入

同時處理語言指令和視覺輸入，實現更精準的動作控制

開源可微調

提供完整訓練代碼和模型檢查點，支持用戶自定義微調

Model Capabilities

視覺-語言理解

機器人動作預測

多模態任務執行

長程動作規劃

Use Cases

機器人控制

機械臂操作

根據自然語言指令和視覺輸入控制機械臂執行抓取、放置等操作

在WidowX機器人任務和LIBERO仿真環境中驗證有效

自動化裝配

通過視覺和語言指導完成複雜裝配任務

屬性	詳情
模型類型	視覺-語言-動作（語言、圖像 => 機器人動作）
語言	英語
許可證	MIT
微調基礎模型	Qwen 2.5 VL - 3B

Featured Recommended AI Models

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers Supports Multiple Languages

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統 Chinese

uer

2,694

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

Nora Long

Model Overview

Model Features

Model Capabilities

Use Cases

🚀 Nora-Long

✨ 主要特性

📦 安裝指南

💻 使用示例

基礎用法

高級用法

📚 詳細文檔

模型描述

模型來源

🔧 技術細節

📄 許可證