物理学模型

2025年最佳的 42 个物理学模型工具

Decision Transformer Gym Hopper Medium

这是一个在Gym Hopper环境中使用中等表现轨迹训练的决策变换器模型，适用于连续控制任务。

物理学模型

Decision Transformer Gym Hopper Expert

这是一个经过训练的决策变换器模型，其训练数据来源于Gym Hopper环境中的专家轨迹。

物理学模型

Ppo MountainCarContinuous V0

这是一个基于PPO算法的强化学习智能体，专门为MountainCarContinuous-v0环境训练，能够有效解决连续控制的山地车问题。

物理学模型

这是一个基于 stable-baselines3 库训练的 DQN 强化学习智能体，专门用于解决 Acrobot-v1 控制问题。

物理学模型

Burgers Inverse

利用深度学习解决伯格斯方程反问题的模型，能够预测速度演变和估算物理参数

物理学模型

TensorBoard 英语

LWM 1.1是专为无线信道特征提取设计的升级版预训练模型，支持多样化信道配置，提升特征提取质量与泛化能力。

物理学模型

Td3 MountainCarContinuous V0

一个基于stable-baselines3库训练的TD3强化学习智能体，专为MountainCarContinuous-v0环境设计。

物理学模型

LWM是首个无线通信领域的基础模型，作为通用特征提取器开发，能够从无线信道数据中提取精细表征。

物理学模型

Assignment2 Omar

这是一个基于PPO算法的强化学习模型，专门用于解决LunarLander-v2环境中的着陆任务。

物理学模型

Classroom-workshop

PPO LunarLander V2

这是一个基于PPO算法的强化学习模型，专为LunarLander-v2环境训练，能够控制月球着陆器安全着陆。

物理学模型

Decision Transformer Gym Halfcheetah Expert

这是一个经过训练的决策变换器模型，其训练数据来自Gym HalfCheetah环境中采样的专家轨迹。

物理学模型

Mlagents Walker

这是一个使用Unity ML-Agents库训练的PPO智能体模型，专门用于Walker环境。

物理学模型

Ppo LunarLander V2

这是一个基于PPO算法的强化学习模型，专门用于解决LunarLander-v2环境中的着陆任务。

物理学模型

Ppo LunarLander V2

这是一个基于PPO算法的强化学习模型，专门用于解决LunarLander-v2环境中的着陆任务。

物理学模型

BART Lagrangian

基于BART架构的序列到序列Transformer模型，专门用于生成粒子物理学的拉格朗日量。

物理学模型

Ppo Pendulum V1

这是一个基于PPO算法的强化学习模型，专门用于解决Pendulum-v1环境中的控制问题。

物理学模型

Ppo HalfCheetah V3

这是一个基于PPO算法的强化学习模型，专为HalfCheetah-v3环境设计，由stable-baselines3库训练。

物理学模型

这是一个基于SAC算法的强化学习模型，用于在Hopper-v3环境中控制机器人跳跃运动。

物理学模型

Sac Walker2d V3

这是一个基于SAC算法的强化学习模型，专为Walker2d-v3环境设计，能够控制双足机器人行走。

物理学模型

Vintix是一个通过上下文强化学习实现的多任务动作模型，在多个基准测试中表现出色。

物理学模型英语

Mlagents Pyramids

这是一个基于PPO算法的强化学习智能体，使用Unity ML-Agents在金字塔环境中训练而成。

物理学模型

Sac Pendulum V1

这是一个基于SAC算法的强化学习模型，用于解决Pendulum-v1环境中的控制问题。

物理学模型

这是一个基于stable-baselines3库训练的TD3智能体模型，专门用于Hopper-v3环境中的强化学习任务。

物理学模型

Decision Transformer Gym Halfcheetah Medium

这是一个基于决策变换器架构的强化学习模型，专门针对Gym HalfCheetah连续控制环境训练，使用中等质量轨迹数据进行训练。

物理学模型

Testpyramidsrnd

这是一个基于PPO算法的强化学习智能体，专门针对Unity ML-Agents的金字塔环境进行训练

物理学模型

Td3 HalfCheetah V3

这是一个基于stable-baselines3库训练的TD3强化学习智能体，专为HalfCheetah-v3环境设计，平均奖励达到9709.01。

物理学模型

该模型是一个用于时间序列预测的模型，支持英语语言，使用特定的许可证（bethana15）。

物理学模型英语

Ppo MountainCar V0

这是一个基于 PPO 算法的深度强化学习模型，专门用于解决 MountainCar-v0 环境中的控制问题。

物理学模型

Ppo LunarLander V2

这是一个基于PPO算法的强化学习模型，用于解决月球着陆器-v2环境中的控制任务。

物理学模型

这是一个基于 stable-baselines3 库训练的 PPO 强化学习模型，专门用于 Hopper-v3 环境中的连续控制任务。

物理学模型

Dqn Mountaincar V0

这是一个基于深度Q网络(DQN)的强化学习智能体，专门训练用于解决MountainCar-v0环境中的控制问题。

物理学模型

Dqn Mountaincar V0 Zoo

这是一个基于深度Q网络(DQN)的强化学习智能体，专门用于解决MountainCar-v0环境中的任务。

物理学模型

Ppo Pendulum V1

这是一个基于PPO算法的强化学习模型，用于解决Pendulum-v1环境中的控制问题。

物理学模型

Ppo LunarLander V2

这是一个基于PPO算法的强化学习模型，专门针对LunarLander-v2环境训练，用于控制月球着陆器安全着陆。

物理学模型

Ppo LunarLanderContinuous V2

这是一个基于PPO算法的强化学习智能体，专为LunarLanderContinuous-v2环境训练，能够控制登月器平稳着陆。

物理学模型

Decision Transformer Gym Walker2d Expert

这是一个经过训练的决策变换器模型，其训练数据来源于Gym Walker2d环境中采样的专家轨迹。

物理学模型

Ppo CartPole V1

这是一个使用 stable-baselines3 库训练的 PPO 智能体模型，专门用于解决 CartPole-v1 强化学习任务。

物理学模型

Ppo LunarLander V2

这是一个基于PPO算法的强化学习模型，专门针对LunarLander-v2环境进行训练，能够控制登月器安全着陆。

物理学模型

Mlagents Pyramids

这是一个基于PPO算法的强化学习智能体，在Unity的ML-Agents金字塔环境中训练完成

物理学模型

Ppo LunarLander V2

这是一个基于PPO算法的强化学习模型，专门用于解决LunarLander-v2环境中的着陆任务。

物理学模型

Testpyramidsrnd

这是一个基于PPO算法的强化学习智能体，专门训练用于在Unity的ML-Agents金字塔环境中进行导航和任务解决。

物理学模型

Sealswalker2d V0

这是一个基于PPO算法的强化学习智能体，专门为seals/Walker2d-v0环境训练，用于控制Walker2d机器人行走任务。

物理学模型

AIbase

智启未来，您的人工智能解决方案智库

English 简体中文繁體中文にほんご

© 2025AIbase