testwormオープンソース強化学習エージェント - 無料でデプロイして、スネークゲームをプレイするのを支援

Home

Testworm

Developed by curt-tigges

PPOアルゴリズムに基づく強化学習エージェントで、スネークゲームをプレイするために特別にトレーニングされています

画像生成

TensorBoard

#UnityゲームAI #深層強化学習 #スネークゲームエージェント

Downloads 85

Release Time : 9/5/2022

Model Overview

このモデルはUnity ML-Agentsフレームワークを使用してトレーニングされ、PPO（近位方策最適化）アルゴリズムを採用しており、自律的にスネークゲームをプレイできます。

Model Features

PPOアルゴリズムベース

近位方策最適化アルゴリズムを使用してトレーニングされており、これは先進的な強化学習アルゴリズムです

Unity ML-Agents統合

Unity ML-Agentsフレームワークと完全互換で、Unity環境での展開と実行が容易です

スネークゲーム専門

スネークゲームに特化してトレーニングされており、自律的に意思決定を行いゲーム目標を達成できます

Model Capabilities

スネークゲーム制御

強化学習意思決定

ゲーム戦略最適化

Use Cases

ゲームAI

スネークゲームAI

スネークゲームのAI対戦相手またはデモンストレーションAIとして

自律的にスネークゲームを完了できます

強化学習教育

PPOアルゴリズム例

PPOアルゴリズムの実際の応用例として

シンプルなゲームにおけるPPOアルゴリズムのパフォーマンスを展示

Featured Recommended AI Models

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers Supports Multiple Languages

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム Chinese

uer

2,694

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

Testworm

Model Overview

Model Features

Model Capabilities

Use Cases

🚀 ppo エージェントによる Worm ゲームのプレイ

🚀 クイックスタート

📚 ドキュメント

📦 インストール

学習の再開

💻 使用例

基本的な使用法