test_wormオープンソース強化学習エージェント - 無料でUnityワームゲームのトレーニングをサポート

ホーム

Test Worm

damilare-akinによって開発

これはPPOアルゴリズムに基づく強化学習エージェントで、Unityのワームゲーム向けに特別にトレーニングされました。

画像生成

TensorBoard

#UnityゲームAI #深層強化学習 #PPOアルゴリズム

ダウンロード数 15

リリース時間 : 10/17/2022

モデル概要

このモデルはUnity ML-Agentsライブラリでトレーニングされ、ワームゲームで自律的に学習し意思決定できます。

モデル特徴

PPOアルゴリズムベース

Proximal Policy Optimizationアルゴリズムを使用してトレーニングされており、これは先進的な強化学習アルゴリズムです。

Unity ML-Agents統合

Unity ML-Agentsフレームワークと完全互換で、Unity環境での展開と使用が容易です。

リアルタイムゲームデモ

Hugging Face Spacesを通じてリアルタイムのゲームデモを視聴できます。

モデル能力

ワームゲーム制御

強化学習意思決定

ゲーム環境適応

使用事例

ゲームAI

ワームゲームAI

ワームゲームにおけるインテリジェントな対戦相手または自動プレイヤーとして

自律的にゲームタスクを完了可能

強化学習研究

PPOアルゴリズムデモ

ゲーム環境におけるPPOアルゴリズムの応用効果を展示

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Test Worm

モデル概要

モデル特徴

モデル能力

使用事例

🚀 PPOエージェントによる「Worm」ゲームのプレイ

🚀 クイックスタート

📚 ドキュメント

📦 インストール

学習の再開

💻 使用例

エージェントのプレイを見る