すべてのカテゴリ

物理学モデル

2025年最高の 42 個の物理学モデルツール

Decision Transformer Gym Hopper Medium

これはGym Hopper環境で中程度のパフォーマンス軌跡を使用して訓練された意思決定トランスフォーマーモデルで、連続制御タスクに適しています。

物理学モデル

Decision Transformer Gym Hopper Expert

これはGym Hopper環境のエキスパート軌跡データで訓練された意思決定トランスフォーマーモデルです。

物理学モデル

Ppo MountainCarContinuous V0

これはPPOアルゴリズムに基づく強化学習エージェントで、MountainCarContinuous-v0環境向けに特別に訓練されており、連続制御のマウンテンカー問題を効果的に解決できます。

物理学モデル

これはstable-baselines3ライブラリでトレーニングされたDQN強化学習エージェントで、Acrobot-v1制御問題を解決するために特別に設計されています。

物理学モデル

Burgers Inverse

深層学習を用いてバーガース方程式の逆問題を解決するモデルで、速度の時間変化を予測し物理パラメータを推定可能

物理学モデル

TensorBoard 英語

LWM 1.1は無線チャネル特徴抽出のために特別に設計されたアップグレード版事前学習モデルで、多様なチャネル設定をサポートし、特徴抽出の品質と汎化能力を向上させます。

物理学モデル

Td3 MountainCarContinuous V0

stable-baselines3ライブラリで訓練されたTD3強化学習エージェントで、MountainCarContinuous-v0環境専用に設計されています。

物理学モデル

LWMは無線通信分野初の基盤モデルで、汎用特徴抽出器として開発され、無線チャネルデータから精緻な表現を抽出できます。

物理学モデル

Assignment2 Omar

これはPPOアルゴリズムに基づく強化学習モデルで、LunarLander-v2環境における着陸タスクを解決するために特別に設計されています。

物理学モデル

Classroom-workshop

PPO LunarLander V2

これはPPOアルゴリズムに基づく強化学習モデルで、LunarLander-v2環境向けに訓練され、月面着陸機を安全に着陸させることができます。

物理学モデル

Decision Transformer Gym Halfcheetah Expert

これはGym HalfCheetah環境からサンプリングされた専門家軌跡で訓練された意思決定トランスフォーマーモデルです。

物理学モデル

Mlagents Walker

これはUnity ML-AgentsライブラリでトレーニングされたPPOエージェントモデルで、Walker環境専用です。

物理学モデル

Ppo LunarLander V2

これはPPOアルゴリズムに基づく強化学習モデルで、LunarLander-v2環境における着陸タスクを解決するために特別に設計されています。

物理学モデル

Ppo LunarLander V2

これはPPOアルゴリズムに基づく強化学習モデルで、LunarLander-v2環境における着陸タスクを解決するために特別に設計されています。

物理学モデル

BART Lagrangian

BARTアーキテクチャに基づくシーケンス・ツー・シーケンストランスフォーマーモデルで、粒子物理学のラグランジアンを生成するために特別に設計されています。

物理学モデル

Ppo Pendulum V1

これはPPOアルゴリズムに基づく強化学習モデルで、Pendulum-v1環境における制御問題を解決するために特別に設計されています。

物理学モデル

Ppo HalfCheetah V3

これはPPOアルゴリズムに基づく強化学習モデルで、HalfCheetah-v3環境向けに設計されており、stable-baselines3ライブラリでトレーニングされています。

物理学モデル

これはSACアルゴリズムに基づく強化学習モデルで、Hopper-v3環境でロボットのジャンプ動作を制御するために使用されます。

物理学モデル

Sac Walker2d V3

これはSACアルゴリズムに基づく強化学習モデルで、Walker2d-v3環境向けに設計されており、二足ロボットの歩行を制御できます。

物理学モデル

Vintixはコンテキスト強化学習によるマルチタスクアクションモデルで、複数のベンチマークテストで優れた性能を発揮します。

物理学モデル英語

Mlagents Pyramids

これはPPOアルゴリズムに基づく強化学習エージェントで、Unity ML-Agentsのピラミッド環境でトレーニングされました。

物理学モデル

Sac Pendulum V1

これはSACアルゴリズムに基づく強化学習モデルで、Pendulum-v1環境における制御問題を解決するためのものです。

物理学モデル

これはstable-baselines3ライブラリで訓練されたTD3エージェントモデルで、Hopper-v3環境における強化学習タスク専用です。

物理学モデル

Decision Transformer Gym Halfcheetah Medium

これは意思決定トランスフォーマーアーキテクチャに基づく強化学習モデルで、Gym HalfCheetah連続制御環境向けに特別に訓練され、中程度の品質の軌跡データを使用しています。

物理学モデル

Testpyramidsrnd

これはPPOアルゴリズムに基づく強化学習エージェントで、Unity ML-Agentsのピラミッド環境向けに特別に訓練されています

物理学モデル

Td3 HalfCheetah V3

これはstable-baselines3ライブラリで訓練されたTD3強化学習エージェントで、HalfCheetah-v3環境向けに設計されており、平均報酬は9709.01を達成しています。

物理学モデル

このモデルは時系列予測用のモデルで、英語をサポートし、特定のライセンス（bethana15）を使用しています。

物理学モデル英語

Ppo MountainCar V0

これはPPOアルゴリズムに基づく深層強化学習モデルで、MountainCar-v0環境における制御問題を解決するために特別に設計されています。

物理学モデル

Ppo LunarLander V2

これはPPOアルゴリズムに基づく強化学習モデルで、月面着陸機-v2環境における制御タスクを解決するためのものです。

物理学モデル

これはstable-baselines3ライブラリで訓練されたPPO強化学習モデルで、Hopper-v3環境における連続制御タスク専用です。

物理学モデル

Dqn Mountaincar V0

これは深層Qネットワーク(DQN)に基づく強化学習エージェントで、MountainCar-v0環境の制御問題解決のために特別に訓練されています。

物理学モデル

Ppo LunarLander V2

これはPPOアルゴリズムに基づく強化学習モデルで、LunarLander-v2環境向けに訓練され、月面着陸船の安全な着陸を制御するために使用されます。

物理学モデル

Ppo Pendulum V1

これはPPOアルゴリズムに基づく強化学習モデルで、Pendulum-v1環境における制御問題を解決するためのものです。

物理学モデル

Dqn Mountaincar V0 Zoo

これは深層Qネットワーク(DQN)に基づく強化学習エージェントで、MountainCar-v0環境のタスク解決に特化しています。

物理学モデル

Ppo LunarLanderContinuous V2

これはPPOアルゴリズムに基づく強化学習エージェントで、LunarLanderContinuous-v2環境向けに訓練され、月着陸船を安定着陸させることができます。

物理学モデル

Decision Transformer Gym Walker2d Expert

このモデルはGym Walker2d環境からサンプリングされた専門家軌跡に基づいて訓練された意思決定トランスフォーマーモデルです。

物理学モデル

Ppo LunarLander V2

これはPPOアルゴリズムに基づく強化学習モデルで、LunarLander-v2環境向けに特別に訓練され、月着陸船を安全に着陸させることができます。

物理学モデル

Ppo CartPole V1

これはstable-baselines3ライブラリで訓練されたPPOエージェントモデルで、CartPole-v1強化学習タスクを解決するために特別に設計されています。

物理学モデル

Mlagents Pyramids

これはPPOアルゴリズムに基づく強化学習エージェントで、UnityのML-Agentsピラミッド環境で訓練されています

物理学モデル

Ppo LunarLander V2

これはPPOアルゴリズムに基づく強化学習モデルで、LunarLander-v2環境における着陸タスクを解決するために特別に設計されています。

物理学モデル

Testpyramidsrnd

これはPPOアルゴリズムに基づく強化学習エージェントで、UnityのML-Agentsピラミッド環境でのナビゲーションとタスク解決のために特別に訓練されています。

物理学モデル

Sealswalker2d V0

これはPPOアルゴリズムに基づく強化学習エージェントで、seals/Walker2d-v0環境向けに訓練され、Walker2dロボットの歩行制御タスクに使用されます。

物理学モデル

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase