PPO - Huggyオープンソースモデル - 無料でデプロイ可能、仮想犬のハジの行動を精密に制御するために使用

ホーム

Ppo Huggy

hellonihaoによって開発

これはUnity ML-AgentsライブラリでトレーニングされたPPOエージェントモデルで、バーチャル犬ハギーの行動制御に特化しています。

物体検出

TensorBoard

#Unityエージェントトレーニング #深層強化学習 #バーチャルペットインタラクション

ダウンロード数 52

リリース時間 : 2/18/2025

モデル概要

このモデルは深層強化学習のPPOアルゴリズムを使用してトレーニングされ、バーチャル犬ハギーが棒を拾うなどの特定のタスクを実行するための制御に使用されます。

モデル特徴

Unity ML-Agentsベース

Unity ML-Agentsライブラリを使用してトレーニングおよびデプロイされ、Unityバーチャル環境と互換性があります

PPOアルゴリズム

深層強化学習のPPOアルゴリズムを採用し、トレーニングの安定性と効率をバランスさせています

インタラクティブデモ

ブラウザで直接エージェントの動作状況を観察できます

モデル能力

バーチャルキャラクター制御

強化学習意思決定

環境インタラクション

使用事例

ゲームAI

バーチャルペット制御

バーチャル犬が棒を拾うなどのインタラクティブタスクを実行するように制御

エージェントの学習後の行動表現を観察可能

教育デモ

強化学習教育

PPOアルゴリズムのバーチャル環境での応用を展示

強化学習トレーニングプロセスを直感的に展示

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Ppo Huggy

モデル概要

モデル特徴

モデル能力

使用事例

🚀 ppoエージェントによるHuggyのプレイ

🚀 クイックスタート

📚 ドキュメント

💻 使用例

訓練の再開

エージェントのプレイを見る