decision-transformer-gym-walker2d-expertオープンソースモデル - エキスパートの軌跡に基づき決定支援

ホーム

Decision Transformer Gym Walker2d Expert

edbeechingによって開発

このモデルはGym Walker2d環境からサンプリングされた専門家軌跡に基づいて訓練された意思決定トランスフォーマーモデルです。

物理学モデル

Transformers

#強化学習制御 #連続行動決定 #専門家軌跡学習

ダウンロード数 14

リリース時間 : 3/16/2022

モデル概要

このモデルは意思決定トランスフォーマーアーキテクチャを使用し、Gym Walker2dの連続制御環境に特化して訓練されており、効果的な制御戦略を生成できます。

モデル特徴

専門家軌跡訓練

モデルはGym Walker2d環境からサンプリングされた専門家軌跡に基づいて訓練されています

標準化処理

平均値と標準偏差を含む完全な標準化係数を提供します

連続制御能力

Walker2dなどの連続制御環境に特化して最適化されています

モデル能力

連続行動空間制御

強化学習戦略生成

ロボット運動制御

使用事例

ロボット制御

二足歩行ロボットの歩行制御

二足歩行ロボットの歩行戦略生成に適用

安定した歩行制御を実現可能

強化学習研究

意思決定トランスフォーマーアルゴリズム検証

連続制御タスクにおける意思決定トランスフォーマーの性能検証に使用

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Decision Transformer Gym Walker2d Expert

モデル概要

モデル特徴

モデル能力

使用事例

🚀 デシジョントランスフォーマーモデル（Gym Walker2d環境のエキスパート軌跡で学習）