ML Agents SnowballFight 1vs1
Unity ML-Agentsベースの1対1雪合戦マルチエージェントトレーニング環境で、深層強化学習アルゴリズムのトレーニングをサポート
ダウンロード数 22
リリース時間 : 3/2/2022
モデル概要
これはマルチエージェント対戦トレーニング専用に設計されたUnity環境で、雪合戦シナリオをシミュレートし、エージェントの協力と競争戦略の研究に使用可能
モデル特徴
マルチモーダル観測空間
レイキャスト検知(前方30本+後方3本)とベクトル観測(速度/位置/HPなど)を組み合わせ、豊富な環境情報を提供
競技対戦メカニズム
ダメージ報酬、時間ペナルティなどの設計を含み、エージェントが攻防戦略を学習するのをサポート
自己対戦トレーニングサポート
設定ファイルに自己対戦パラメータがプリセットされており、エージェントが対戦を通じて継続的に進化するのをサポート
可視化デモ
トレーニング済みモデルとオンラインデモリンクを提供し、結果展示を容易にする
モデル能力
マルチエージェント対戦トレーニング
強化学習アルゴリズム検証
戦略ゲーム研究
リアルタイム環境インタラクション
使用事例
学術研究
マルチエージェント協力戦略研究
対戦環境におけるエージェントの戦術連携と戦略進化を研究
ELOレーティング1766のエージェントをトレーニング
深層強化学習アルゴリズム検証
PPOなどのアルゴリズムのマルチエージェントトレーニング効果をテストする標準環境として
510万ステップのトレーニング検証を完了
教育デモ
強化学習教育事例
可視化対戦を通じて強化学習トレーニングプロセスを展示
オンラインデモとトレーニングモデルを提供
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98