T

Theia Base Patch16 224 Cddsv

theaiinstituteによって開発
テイアはロボット学習向けの視覚基盤モデルで、複数の視覚基盤モデルを蒸留することで豊富な視覚表現能力を獲得しています
ダウンロード数 5,404
リリース時間 : 9/30/2024

モデル概要

テイアは複数の視覚基盤モデルを蒸留したロボット学習専用の視覚モデルで、下流のロボット学習タスクの性能を向上させます。実験では、より少ないトレーニングデータとより小さいモデルサイズで既存モデルを上回ることが証明されています。

モデル特徴

マルチモデル蒸留
CLIP、Depth Anything、DINOv2、Segment Anything、ViTの5つの視覚基盤モデルの知識を同時に蒸留
効率的な学習
より少ないトレーニングデータと小さいモデルサイズで教師モデルを上回る性能
多様な視覚表現
豊富な視覚知識をエンコードし、様々なロボット学習タスクに適用可能

モデル能力

視覚特徴抽出
深度推定
画像セグメンテーション
視覚表現学習

使用事例

ロボット学習
ロボット視覚ナビゲーション
豊富な視覚表現を活用して環境理解とナビゲーションを支援
少量のトレーニングデータで従来モデルを上回る性能を実現
物体認識と操作
複数の視覚知識を組み合わせた物体認識と操作タスク
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase