2025年最佳的 42 个物理学模型工具

Decision Transformer Gym Hopper Medium
这是一个在Gym Hopper环境中使用中等表现轨迹训练的决策变换器模型,适用于连续控制任务。
物理学模型 Transformers
D
edbeeching
6,518
6
Decision Transformer Gym Hopper Expert
这是一个经过训练的决策变换器模型,其训练数据来源于Gym Hopper环境中的专家轨迹。
物理学模型 Transformers
D
edbeeching
727
19
Ppo MountainCarContinuous V0
这是一个基于PPO算法的强化学习智能体,专门为MountainCarContinuous-v0环境训练,能够有效解决连续控制的山地车问题。
物理学模型
P
sb3
433
1
Dqn Acrobot V1
这是一个基于 stable-baselines3 库训练的 DQN 强化学习智能体,专门用于解决 Acrobot-v1 控制问题。
物理学模型
D
sb3
403
0
Burgers Inverse
利用深度学习解决伯格斯方程反问题的模型,能够预测速度演变和估算物理参数
物理学模型 TensorBoard 英语
B
piotrnobis
335
0
Lwm V1.1
LWM 1.1是专为无线信道特征提取设计的升级版预训练模型,支持多样化信道配置,提升特征提取质量与泛化能力。
物理学模型 Transformers
L
wi-lab
277
1
Td3 MountainCarContinuous V0
一个基于stable-baselines3库训练的TD3强化学习智能体,专为MountainCarContinuous-v0环境设计。
物理学模型
T
sb3
203
0
Lwm
LWM是首个无线通信领域的基础模型,作为通用特征提取器开发,能够从无线信道数据中提取精细表征。
物理学模型 Transformers
L
wi-lab
137
3
Assignment2 Omar
这是一个基于PPO算法的强化学习模型,专门用于解决LunarLander-v2环境中的着陆任务。
物理学模型
A
Classroom-workshop
135
3
PPO LunarLander V2
这是一个基于PPO算法的强化学习模型,专为LunarLander-v2环境训练,能够控制月球着陆器安全着陆。
物理学模型
P
BioGeek
102
0
Decision Transformer Gym Halfcheetah Expert
这是一个经过训练的决策变换器模型,其训练数据来自Gym HalfCheetah环境中采样的专家轨迹。
物理学模型 Transformers
D
edbeeching
98
1
Mlagents Walker
这是一个使用Unity ML-Agents库训练的PPO智能体模型,专门用于Walker环境。
物理学模型 TensorBoard
M
Forkits
81
0
Ppo LunarLander V2
这是一个基于PPO算法的强化学习模型,专门用于解决LunarLander-v2环境中的着陆任务。
物理学模型
P
sb3
73
0
Ppo LunarLander V2
这是一个基于PPO算法的强化学习模型,专门用于解决LunarLander-v2环境中的着陆任务。
物理学模型
P
araffin
65
18
BART Lagrangian
Gpl-3.0
基于BART架构的序列到序列Transformer模型,专门用于生成粒子物理学的拉格朗日量。
物理学模型 Transformers
B
JoseEliel
61
1
Ppo Pendulum V1
这是一个基于PPO算法的强化学习模型,专门用于解决Pendulum-v1环境中的控制问题。
物理学模型
P
sb3
51
2
Ppo HalfCheetah V3
这是一个基于PPO算法的强化学习模型,专为HalfCheetah-v3环境设计,由stable-baselines3库训练。
物理学模型
P
sb3
51
1
Sac Hopper V3
这是一个基于SAC算法的强化学习模型,用于在Hopper-v3环境中控制机器人跳跃运动。
物理学模型
S
sb3
44
0
Sac Walker2d V3
这是一个基于SAC算法的强化学习模型,专为Walker2d-v3环境设计,能够控制双足机器人行走。
物理学模型
S
sb3
43
0
Vintix
Apache-2.0
Vintix是一个通过上下文强化学习实现的多任务动作模型,在多个基准测试中表现出色。
物理学模型 英语
V
dunnolab
41
2
Mlagents Pyramids
这是一个基于PPO算法的强化学习智能体,使用Unity ML-Agents在金字塔环境中训练而成。
物理学模型 TensorBoard
M
danielcfho
40
0
Sac Pendulum V1
这是一个基于SAC算法的强化学习模型,用于解决Pendulum-v1环境中的控制问题。
物理学模型
S
sb3
39
0
Td3 Hopper V3
这是一个基于stable-baselines3库训练的TD3智能体模型,专门用于Hopper-v3环境中的强化学习任务。
物理学模型
T
sb3
30
0
Decision Transformer Gym Halfcheetah Medium
这是一个基于决策变换器架构的强化学习模型,专门针对Gym HalfCheetah连续控制环境训练,使用中等质量轨迹数据进行训练。
物理学模型 Transformers
D
edbeeching
27
0
Testpyramidsrnd
这是一个基于PPO算法的强化学习智能体,专门针对Unity ML-Agents的金字塔环境进行训练
物理学模型 TensorBoard
T
croumegous
23
0
Td3 HalfCheetah V3
这是一个基于stable-baselines3库训练的TD3强化学习智能体,专为HalfCheetah-v3环境设计,平均奖励达到9709.01。
物理学模型
T
sb3
23
0
FFNN
其他
该模型是一个用于时间序列预测的模型,支持英语语言,使用特定的许可证(bethana15)。
物理学模型 英语
F
bethana
22
0
Ppo MountainCar V0
这是一个基于 PPO 算法的深度强化学习模型,专门用于解决 MountainCar-v0 环境中的控制问题。
物理学模型
P
sb3
21
1
Ppo LunarLander V2
这是一个基于PPO算法的强化学习模型,用于解决月球着陆器-v2环境中的控制任务。
物理学模型
P
sigalaz
20
0
Ppo Hopper V3
这是一个基于 stable-baselines3 库训练的 PPO 强化学习模型,专门用于 Hopper-v3 环境中的连续控制任务。
物理学模型
P
sb3
19
0
Dqn Mountaincar V0
这是一个基于深度Q网络(DQN)的强化学习智能体,专门训练用于解决MountainCar-v0环境中的控制问题。
物理学模型
D
Galeros
18
0
Dqn Mountaincar V0 Zoo
这是一个基于深度Q网络(DQN)的强化学习智能体,专门用于解决MountainCar-v0环境中的任务。
物理学模型
D
Galeros
16
0
Ppo Pendulum V1
这是一个基于PPO算法的强化学习模型,用于解决Pendulum-v1环境中的控制问题。
物理学模型
P
ernestumorga
16
0
Ppo LunarLander V2
这是一个基于PPO算法的强化学习模型,专门针对LunarLander-v2环境训练,用于控制月球着陆器安全着陆。
物理学模型
P
andri
16
0
Ppo LunarLanderContinuous V2
这是一个基于PPO算法的强化学习智能体,专为LunarLanderContinuous-v2环境训练,能够控制登月器平稳着陆。
物理学模型
P
sb3
15
0
Decision Transformer Gym Walker2d Expert
这是一个经过训练的决策变换器模型,其训练数据来源于Gym Walker2d环境中采样的专家轨迹。
物理学模型 Transformers
D
edbeeching
14
4
Ppo CartPole V1
这是一个使用 stable-baselines3 库训练的 PPO 智能体模型,专门用于解决 CartPole-v1 强化学习任务。
物理学模型
P
somya17ban
14
1
Ppo LunarLander V2
这是一个基于PPO算法的强化学习模型,专门针对LunarLander-v2环境进行训练,能够控制登月器安全着陆。
物理学模型
P
sofiascat
14
1
Mlagents Pyramids
这是一个基于PPO算法的强化学习智能体,在Unity的ML-Agents金字塔环境中训练完成
物理学模型 TensorBoard
M
a-doering
14
0
Ppo LunarLander V2
这是一个基于PPO算法的强化学习模型,专门用于解决LunarLander-v2环境中的着陆任务。
物理学模型
P
tooalvin
13
1
Testpyramidsrnd
这是一个基于PPO算法的强化学习智能体,专门训练用于在Unity的ML-Agents金字塔环境中进行导航和任务解决。
物理学模型 TensorBoard
T
adil-o
13
0
Sealswalker2d V0
这是一个基于PPO算法的强化学习智能体,专门为seals/Walker2d-v0环境训练,用于控制Walker2d机器人行走任务。
物理学模型
S
ernestumorga
0
0
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase