MLAgents - ピラミッドオープンソース強化学習エージェント

ホーム

Mlagents Pyramids

a-doeringによって開発

これはPPOアルゴリズムに基づく強化学習エージェントで、UnityのML-Agentsピラミッド環境で訓練されています

物理学モデル

TensorBoard

#Unity強化学習 #3D環境ナビゲーション #PPOアルゴリズム実装

ダウンロード数 14

リリース時間 : 7/5/2022

モデル概要

このモデルはUnity ML-Agentsフレームワークで訓練された深層強化学習エージェントで、PPOアルゴリズムを使用してピラミッド環境でのナビゲーションとタスク解決能力を学習しています

モデル特徴

Unity環境での訓練

Unityの3Dピラミッド環境で訓練されており、複雑な3D空間ナビゲーションを処理する能力を備えています

PPOアルゴリズム実装

Proximal Policy Optimizationアルゴリズムを採用し、探索と活用のバランスを取り、安定した方策学習を実現しています

リアルタイム可視化

ブラウザでエージェントの動作をリアルタイムに観察できます

モデル能力

3D環境ナビゲーション

障害物回避

目標指向行動

強化学習方策最適化

使用事例

ゲームAI

NPCインテリジェントナビゲーション

ゲーム内のNPCが複雑な3D環境で自律的にナビゲートするために使用できます

ロボット制御

仮想ロボット訓練

実際のロボット制御方策の仮想訓練環境として使用できます

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Mlagents Pyramids

モデル概要

モデル特徴

モデル能力

使用事例

🚀 PPOエージェントによる「Pyramids」のプレイ

🚀 クイックスタート

📦 インストール

トレーニングの再開

💻 使用例

エージェントのプレイを見る