Vintix開源多任務動作模型 - 藉助上下文學習，多基準測試表現出色！

首頁

Vintix

由dunnolab開發

Vintix是一個通過上下文強化學習實現的多任務動作模型，在多個基準測試中表現出色。

物理學模型英語開源協議:Apache-2.0 #多任務強化學習 #高維動作控制 #工業機器人控制

下載量 41

發布時間 : 3/3/2025

模型概述

Vintix是基於上下文強化學習的動作模型，專門設計用於處理多任務強化學習場景，在MuJoCo、元世界、雙手靈巧操作和工業基準等數據集上表現優異。

模型特點

多任務強化學習

能夠同時處理多種強化學習任務，包括物理模擬和工業基準測試

高性能表現

在多個基準測試中IQM標準化得分達到0.99，表現優異

大規模模型

擁有3.32億參數和20層結構，具備強大的學習能力

模型能力

物理環境模擬

工業任務處理

雙手靈巧操作

多任務強化學習

上下文學習

使用案例

機器人控制

MuJoCo物理模擬

用於機器人物理運動和環境交互的模擬

標準化得分IQM達到0.99

雙手靈巧操作

機器人雙手協調操作任務

標準化得分IQM達到0.92

工業應用

工業基準測試

工業環境中的複雜任務處理

標準化得分IQM達到0.99

屬性	詳情
參數數量	3.32億
模型大小	層數：20，頭數：16，嵌入維度：1024
序列長度	8192
訓練數據	MuJoCo、Meta-World、Bi-DexHands、工業基準測試數據集

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Vintix

模型概述

模型特點

模型能力

使用案例

🚀 Vintix模型

🚀 快速開始

📚 詳細文檔

模型詳情

模型描述

模型來源

📄 許可證

📖 引用