decision-transformer-gym-walker2d-expert開源模型 - 基於專家軌跡助力決策制定

首頁

Decision Transformer Gym Walker2d Expert

由edbeeching開發

這是一個經過訓練的決策變換器模型，其訓練數據來源於Gym Walker2d環境中採樣的專家軌跡。

物理學模型

Transformers

#強化學習控制 #連續動作決策 #專家軌跡學習

下載量 14

發布時間 : 3/16/2022

模型概述

該模型使用決策變換器架構，專門針對Gym Walker2d連續控制環境進行訓練，能夠生成有效的控制策略。

模型特點

專家軌跡訓練

模型基於Gym Walker2d環境中採樣的專家軌跡進行訓練

標準化處理

提供完整的標準化係數，包括均值和標準差

連續控制能力

專門針對Walker2d等連續控制環境優化

模型能力

連續動作空間控制

強化學習策略生成

機器人運動控制

使用案例

機器人控制

雙足機器人行走控制

應用於雙足機器人行走策略生成

可實現穩定的行走控制

強化學習研究

決策變換器算法驗證

用於驗證決策變換器在連續控制任務中的表現

屬性	詳情
模型類型	決策變壓器（Decision Transformer）
訓練數據	從Gym Walker2d環境中採樣的專家軌跡

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Decision Transformer Gym Walker2d Expert

模型概述

模型特點

模型能力

使用案例

🚀 決策變壓器模型（基於Gym Walker2d環境的專家軌跡訓練）

🚀 快速開始

📚 詳細文檔

模型信息

標籤信息

管道標籤