Worm-Unity-MLオープンソースゲームモデル - Wormゲームの智能戦略トレーニングを無料で支援する

ホーム

Worm Unity ML

comodoroによって開発

これはUnity ML-Agentsライブラリでトレーニングされたppoエージェントモデルで、Wormゲーム環境専用です。

分子モデル

TensorBoard

#UnityゲームAI #深層強化学習 #PPOアルゴリズム

ダウンロード数 14

リリース時間 : 8/2/2022

モデル概要

このモデルはPPOアルゴリズムに基づく強化学習エージェントで、UnityのWormゲーム環境でプレイできるようにトレーニングされています。

モデル特徴

PPOアルゴリズムベース

Proximal Policy Optimizationアルゴリズムを使用してトレーニングされており、これは先進的な強化学習アルゴリズムです。

Unity ML-Agents統合

Unity ML-Agentsライブラリと完全互換で、Unity環境での展開と使用が容易です。

リアルタイムデモ

ブラウザでエージェントのゲームプレイをリアルタイムで視聴できます。

モデル能力

ゲーム制御

強化学習意思決定

環境インタラクション

使用事例

ゲームAI

WormゲームAI

Wormゲーム内のエージェントとして、自律的にゲームの意思決定を行えます。

Unity環境でスムーズに動作し、ゲームタスクを完了できます。

強化学習研究

PPOアルゴリズム検証

ゲーム環境におけるPPOアルゴリズムの実装例として使用できます。

ゲーム制御タスクにおけるPPOアルゴリズムの有効性を検証しました。

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Worm Unity ML

モデル概要

モデル特徴

モデル能力

使用事例

🚀 PPOエージェントによる「Worm」ゲームのプレイ

🚀 クイックスタート

📚 ドキュメント

📦 インストール

学習の再開

💻 使用例

基本的な使用法