MLAgents - ワームオープンソースモデル - ワームゲーム環境のエージェントトレーニングに無料で使用可能

ホーム

Mlagents Worm

infinitejoyによって開発

これはUnity ML-Agentsを基に訓練されたPPOエージェントモデルで、Wormゲーム環境に特化しています。

物体検出

TensorBoard

#UnityゲームAI #深層強化学習 #PPOアルゴリズム

ダウンロード数 19

リリース時間 : 7/11/2022

モデル概要

このモデルはPPOアルゴリズムを使用してUnityのWormゲーム環境で訓練され、ゲーム内のワームキャラクターを制御して特定のタスクを完了することができます。

モデル特徴

Unity ML-Agentsを基に訓練

Unity公式のML-Agentsフレームワークを使用して訓練され、Unityゲーム環境と互換性があります。

PPOアルゴリズムの実装

Proximal Policy Optimizationアルゴリズムを採用しており、これは安定した強化学習アルゴリズムです。

ゲーム制御能力

Wormゲーム内のキャラクターを移動させ、意思決定を行うことができます。

モデル能力

ゲームキャラクター制御

強化学習による意思決定

環境との相互作用

使用事例

ゲームAI

Wormゲームエージェント

ゲーム環境内のワームキャラクターを制御して特定のタスクを完了します。

強化学習研究

PPOアルゴリズムの検証

ゲーム環境におけるPPOアルゴリズムの実装例として利用できます。

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Mlagents Worm

モデル概要

モデル特徴

モデル能力

使用事例

🚀 ppoエージェントによるWormゲームプレイ

🚀 クイックスタート

📚 ドキュメント

💻 使用例

学習の再開

エージェントのゲームプレイを見る