開源忒伊亞（theia-base-patch16-224-cddsv）模型 - 助力機器人學習的視覺表徵神器

首頁

Theia Base Patch16 224 Cddsv

由theaiinstitute開發

忒伊亞是一個面向機器人學習的視覺基礎模型，通過蒸餾多個視覺基礎模型獲得豐富的視覺表徵能力

3D視覺

Transformers

開源協議:其他 #機器人視覺 #多任務蒸餾 #輕量級骨幹

下載量 5,404

發布時間 : 9/30/2024

模型概述

忒伊亞是一個蒸餾了多個視覺基礎模型的機器人學習專用視覺模型，能夠增強下游機器人學習任務的性能。實驗證明其在更少訓練數據和更小模型規模下優於現有模型。

模型特點

多模型蒸餾

同時蒸餾了CLIP、Depth Anything、DINOv2、Segment Anything和ViT五個視覺基礎模型的知識

高效學習

在更少訓練數據和更小模型規模下性能優於教師模型

多樣化視覺表徵

編碼了豐富的視覺知識，適用於多種機器人學習任務

模型能力

視覺特徵提取

深度估計

圖像分割

視覺表徵學習

使用案例

機器人學習

機器人視覺導航

利用豐富的視覺表徵輔助機器人進行環境理解和導航

在少量訓練數據下實現優於傳統模型的性能

物體識別與操作

結合多種視覺知識進行物體識別和操作任務

🚀 Theia

Theia是一款用於機器人學習的視覺基礎模型，它提煉了多個針對不同視覺任務訓練的現成視覺基礎模型。Theia豐富的視覺表徵對多樣的視覺知識進行編碼，從而提升下游機器人學習的效果。該模型在論文Theia: Distilling Diverse Vision Foundation Models for Robot Learning中被提出，論文中的實驗表明，Theia在使用更少訓練數據和更小模型規模的情況下，性能優於其教師模型和先前的機器人學習模型。演示視頻可在項目頁面查看。

The AI Institute

Theia overview

🚀 快速開始

Theia是一款用於機器人學習的視覺基礎模型，它通過提煉多個視覺基礎模型，為下游機器人學習提供了豐富的視覺表徵，提升了學習效果。

✨ 主要特性

提煉多個現成的視覺基礎模型，編碼多樣的視覺知識。
在使用更少訓練數據和更小模型規模的情況下，性能優於教師模型和先前的機器人學習模型。

📚 詳細文檔

模型詳情

theia-tiny-patch16-224-cddsv 模型以 DeiT-Tiny 為骨幹網絡，同時提煉了 CLIP、Depth Anything、DINOv2、Segment Anything 和 ViT。有關使用的更多信息，請訪問 Theia 倉庫。

引用

如果您在研究中使用了 Theia，請使用以下 BibTeX 條目進行引用：

@article{shang2024theia,
  author    = {Shang, Jinghuan and Schmeckpeper, Karl and May, Brandon B. and Minniti, Maria Vittoria and Kelestemur, Tarik and Watkins, David and Herlant, Laura},
  title     = {Theia: Distilling Diverse Vision Foundation Models for Robot Learning},
  journal   = {arXiv},
  year      = {2024},
}

使用說明

Theia 發佈的預訓練模型權重和代碼可在 The AI Institute 許可證下使用，完整許可證內容如下：

Copyright (c) 2024 Boston Dynamics AI Institute LLC

Redistribution and use in source and binary forms, with or without
modification, are permitted provided that the following conditions are met:
1. Redistributions of source code must retain the copyright notice included
with the software, this list of conditions and the following disclaimer.
2. Redistributions in binary form must reproduce the copyright notice, this
list of conditions and the following disclaimer in the documentation and/or
other materials provided with the distribution.
3. Modified versions of the software must be conspicuously marked as such.
4. The software may only be used for non-commercial research purposes.
For profit enterprises may use the software, subject to this limitation.

THIS SOFTWARE IS PROVIDED BY THE AI INSTITUTE AND CONTRIBUTORS "AS IS" AND
ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, NON-
INFRINGEMENT,TITLE, MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE
DISCLAIMED. IN NO EVENT SHALL THE AI INSTITUTE OR CONTRIBUTORS BE LIABLE FOR
ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, PUNITIVE OR CONSEQUENTIAL
DAMAGES (INCLUDING, BUT NOT LIMITED TO, DAMAGES ARISING OUT OF CLAIMS OF
INTELLECTUAL PROPERTY RIGHTS INFRINGEMENT; PROCUREMENT OF SUBSTITUTE GOODS OR
SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER
CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY,
OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.