decision-transformer-gym-walker2d-expert开源模型 - 基于专家轨迹助力决策制定

首页

Decision Transformer Gym Walker2d Expert

由 edbeeching 开发

这是一个经过训练的决策变换器模型，其训练数据来源于Gym Walker2d环境中采样的专家轨迹。

物理学模型

Transformers

#强化学习控制 #连续动作决策 #专家轨迹学习

下载量 14

发布时间 : 3/16/2022

模型简介

该模型使用决策变换器架构，专门针对Gym Walker2d连续控制环境进行训练，能够生成有效的控制策略。

模型特点

专家轨迹训练

模型基于Gym Walker2d环境中采样的专家轨迹进行训练

标准化处理

提供完整的标准化系数，包括均值和标准差

连续控制能力

专门针对Walker2d等连续控制环境优化

模型能力

连续动作空间控制

强化学习策略生成

机器人运动控制

使用案例

机器人控制

双足机器人行走控制

应用于双足机器人行走策略生成

可实现稳定的行走控制

强化学习研究

决策变换器算法验证

用于验证决策变换器在连续控制任务中的表现

属性	详情
模型类型	决策变压器（Decision Transformer）
训练数据	从Gym Walker2d环境中采样的专家轨迹

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

智启未来，您的人工智能解决方案智库

Decision Transformer Gym Walker2d Expert

模型简介

模型特点

模型能力

使用案例

🚀 决策变压器模型（基于Gym Walker2d环境的专家轨迹训练）

🚀 快速开始

📚 详细文档

模型信息

标签信息

管道标签