decision-transformer-gym-halfcheetah-medium开源强化学习模型

首页

Decision Transformer Gym Halfcheetah Medium

由 edbeeching 开发

这是一个基于决策变换器架构的强化学习模型，专门针对Gym HalfCheetah连续控制环境训练，使用中等质量轨迹数据进行训练。

物理学模型

Transformers

#强化学习控制 #轨迹序列建模 #机器人运动决策

下载量 27

发布时间 : 3/16/2022

模型简介

该模型采用决策变换器架构，能够处理连续控制任务，特别适用于机器人控制和物理模拟环境中的决策问题。

模型特点

轨迹建模能力

能够有效建模和预测中等质量轨迹数据中的动作序列

连续控制优化

专门针对连续控制任务进行优化，适合机器人控制场景

标准化处理

提供完整的归一化系数，便于输入数据的预处理

模型能力

连续动作空间预测

强化学习策略生成

物理模拟环境控制

使用案例

机器人控制

HalfCheetah运动控制

在Gym HalfCheetah环境中实现高效的运动控制

能够生成有效的控制策略使机器人实现稳定运动

强化学习研究

决策变换器应用研究

作为决策变换器在连续控制任务中的基准模型

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

智启未来，您的人工智能解决方案智库

Decision Transformer Gym Halfcheetah Medium

模型简介

模型特点

模型能力

使用案例

🚀 基于Gym HalfCheetah环境中采样的中等轨迹训练的决策转换器模型

🚀 快速开始