2025年最高の 42 個の物理学モデルツール

Decision Transformer Gym Hopper Medium
これはGym Hopper環境で中程度のパフォーマンス軌跡を使用して訓練された意思決定トランスフォーマーモデルで、連続制御タスクに適しています。
物理学モデル Transformers
D
edbeeching
6,518
6
Decision Transformer Gym Hopper Expert
これはGym Hopper環境のエキスパート軌跡データで訓練された意思決定トランスフォーマーモデルです。
物理学モデル Transformers
D
edbeeching
727
19
Ppo MountainCarContinuous V0
これはPPOアルゴリズムに基づく強化学習エージェントで、MountainCarContinuous-v0環境向けに特別に訓練されており、連続制御のマウンテンカー問題を効果的に解決できます。
物理学モデル
P
sb3
433
1
Dqn Acrobot V1
これはstable-baselines3ライブラリでトレーニングされたDQN強化学習エージェントで、Acrobot-v1制御問題を解決するために特別に設計されています。
物理学モデル
D
sb3
403
0
Burgers Inverse
深層学習を用いてバーガース方程式の逆問題を解決するモデルで、速度の時間変化を予測し物理パラメータを推定可能
物理学モデル TensorBoard 英語
B
piotrnobis
335
0
Lwm V1.1
LWM 1.1は無線チャネル特徴抽出のために特別に設計されたアップグレード版事前学習モデルで、多様なチャネル設定をサポートし、特徴抽出の品質と汎化能力を向上させます。
物理学モデル Transformers
L
wi-lab
277
1
Td3 MountainCarContinuous V0
stable-baselines3ライブラリで訓練されたTD3強化学習エージェントで、MountainCarContinuous-v0環境専用に設計されています。
物理学モデル
T
sb3
203
0
Lwm
LWMは無線通信分野初の基盤モデルで、汎用特徴抽出器として開発され、無線チャネルデータから精緻な表現を抽出できます。
物理学モデル Transformers
L
wi-lab
137
3
Assignment2 Omar
これはPPOアルゴリズムに基づく強化学習モデルで、LunarLander-v2環境における着陸タスクを解決するために特別に設計されています。
物理学モデル
A
Classroom-workshop
135
3
PPO LunarLander V2
これはPPOアルゴリズムに基づく強化学習モデルで、LunarLander-v2環境向けに訓練され、月面着陸機を安全に着陸させることができます。
物理学モデル
P
BioGeek
102
0
Decision Transformer Gym Halfcheetah Expert
これはGym HalfCheetah環境からサンプリングされた専門家軌跡で訓練された意思決定トランスフォーマーモデルです。
物理学モデル Transformers
D
edbeeching
98
1
Mlagents Walker
これはUnity ML-AgentsライブラリでトレーニングされたPPOエージェントモデルで、Walker環境専用です。
物理学モデル TensorBoard
M
Forkits
81
0
Ppo LunarLander V2
これはPPOアルゴリズムに基づく強化学習モデルで、LunarLander-v2環境における着陸タスクを解決するために特別に設計されています。
物理学モデル
P
sb3
73
0
Ppo LunarLander V2
これはPPOアルゴリズムに基づく強化学習モデルで、LunarLander-v2環境における着陸タスクを解決するために特別に設計されています。
物理学モデル
P
araffin
65
18
BART Lagrangian
Gpl-3.0
BARTアーキテクチャに基づくシーケンス・ツー・シーケンストランスフォーマーモデルで、粒子物理学のラグランジアンを生成するために特別に設計されています。
物理学モデル Transformers
B
JoseEliel
61
1
Ppo Pendulum V1
これはPPOアルゴリズムに基づく強化学習モデルで、Pendulum-v1環境における制御問題を解決するために特別に設計されています。
物理学モデル
P
sb3
51
2
Ppo HalfCheetah V3
これはPPOアルゴリズムに基づく強化学習モデルで、HalfCheetah-v3環境向けに設計されており、stable-baselines3ライブラリでトレーニングされています。
物理学モデル
P
sb3
51
1
Sac Hopper V3
これはSACアルゴリズムに基づく強化学習モデルで、Hopper-v3環境でロボットのジャンプ動作を制御するために使用されます。
物理学モデル
S
sb3
44
0
Sac Walker2d V3
これはSACアルゴリズムに基づく強化学習モデルで、Walker2d-v3環境向けに設計されており、二足ロボットの歩行を制御できます。
物理学モデル
S
sb3
43
0
Vintix
Apache-2.0
Vintixはコンテキスト強化学習によるマルチタスクアクションモデルで、複数のベンチマークテストで優れた性能を発揮します。
物理学モデル 英語
V
dunnolab
41
2
Mlagents Pyramids
これはPPOアルゴリズムに基づく強化学習エージェントで、Unity ML-Agentsのピラミッド環境でトレーニングされました。
物理学モデル TensorBoard
M
danielcfho
40
0
Sac Pendulum V1
これはSACアルゴリズムに基づく強化学習モデルで、Pendulum-v1環境における制御問題を解決するためのものです。
物理学モデル
S
sb3
39
0
Td3 Hopper V3
これはstable-baselines3ライブラリで訓練されたTD3エージェントモデルで、Hopper-v3環境における強化学習タスク専用です。
物理学モデル
T
sb3
30
0
Decision Transformer Gym Halfcheetah Medium
これは意思決定トランスフォーマーアーキテクチャに基づく強化学習モデルで、Gym HalfCheetah連続制御環境向けに特別に訓練され、中程度の品質の軌跡データを使用しています。
物理学モデル Transformers
D
edbeeching
27
0
Testpyramidsrnd
これはPPOアルゴリズムに基づく強化学習エージェントで、Unity ML-Agentsのピラミッド環境向けに特別に訓練されています
物理学モデル TensorBoard
T
croumegous
23
0
Td3 HalfCheetah V3
これはstable-baselines3ライブラリで訓練されたTD3強化学習エージェントで、HalfCheetah-v3環境向けに設計されており、平均報酬は9709.01を達成しています。
物理学モデル
T
sb3
23
0
FFNN
その他
このモデルは時系列予測用のモデルで、英語をサポートし、特定のライセンス(bethana15)を使用しています。
物理学モデル 英語
F
bethana
22
0
Ppo MountainCar V0
これはPPOアルゴリズムに基づく深層強化学習モデルで、MountainCar-v0環境における制御問題を解決するために特別に設計されています。
物理学モデル
P
sb3
21
1
Ppo LunarLander V2
これはPPOアルゴリズムに基づく強化学習モデルで、月面着陸機-v2環境における制御タスクを解決するためのものです。
物理学モデル
P
sigalaz
20
0
Ppo Hopper V3
これはstable-baselines3ライブラリで訓練されたPPO強化学習モデルで、Hopper-v3環境における連続制御タスク専用です。
物理学モデル
P
sb3
19
0
Dqn Mountaincar V0
これは深層Qネットワーク(DQN)に基づく強化学習エージェントで、MountainCar-v0環境の制御問題解決のために特別に訓練されています。
物理学モデル
D
Galeros
18
0
Ppo LunarLander V2
これはPPOアルゴリズムに基づく強化学習モデルで、LunarLander-v2環境向けに訓練され、月面着陸船の安全な着陸を制御するために使用されます。
物理学モデル
P
andri
16
0
Ppo Pendulum V1
これはPPOアルゴリズムに基づく強化学習モデルで、Pendulum-v1環境における制御問題を解決するためのものです。
物理学モデル
P
ernestumorga
16
0
Dqn Mountaincar V0 Zoo
これは深層Qネットワーク(DQN)に基づく強化学習エージェントで、MountainCar-v0環境のタスク解決に特化しています。
物理学モデル
D
Galeros
16
0
Ppo LunarLanderContinuous V2
これはPPOアルゴリズムに基づく強化学習エージェントで、LunarLanderContinuous-v2環境向けに訓練され、月着陸船を安定着陸させることができます。
物理学モデル
P
sb3
15
0
Decision Transformer Gym Walker2d Expert
このモデルはGym Walker2d環境からサンプリングされた専門家軌跡に基づいて訓練された意思決定トランスフォーマーモデルです。
物理学モデル Transformers
D
edbeeching
14
4
Ppo LunarLander V2
これはPPOアルゴリズムに基づく強化学習モデルで、LunarLander-v2環境向けに特別に訓練され、月着陸船を安全に着陸させることができます。
物理学モデル
P
sofiascat
14
1
Ppo CartPole V1
これはstable-baselines3ライブラリで訓練されたPPOエージェントモデルで、CartPole-v1強化学習タスクを解決するために特別に設計されています。
物理学モデル
P
somya17ban
14
1
Mlagents Pyramids
これはPPOアルゴリズムに基づく強化学習エージェントで、UnityのML-Agentsピラミッド環境で訓練されています
物理学モデル TensorBoard
M
a-doering
14
0
Ppo LunarLander V2
これはPPOアルゴリズムに基づく強化学習モデルで、LunarLander-v2環境における着陸タスクを解決するために特別に設計されています。
物理学モデル
P
tooalvin
13
1
Testpyramidsrnd
これはPPOアルゴリズムに基づく強化学習エージェントで、UnityのML-Agentsピラミッド環境でのナビゲーションとタスク解決のために特別に訓練されています。
物理学モデル TensorBoard
T
adil-o
13
0
Sealswalker2d V0
これはPPOアルゴリズムに基づく強化学習エージェントで、seals/Walker2d-v0環境向けに訓練され、Walker2dロボットの歩行制御タスクに使用されます。
物理学モデル
S
ernestumorga
0
0
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase