V

Vit Msn Small

facebookによって開発
この視覚TransformerモデルはMSN手法で事前学習されており、少数ショット学習シナリオに適しており、特に画像分類タスクに最適です。
ダウンロード数 3,755
リリース時間 : 9/9/2022

モデル概要

このモデルはTransformerアーキテクチャに基づく視覚モデルで、MSN(Masked Siamese Networks)手法による事前学習を通じて画像の内在的な表現を効果的に学習でき、少数ショットや極少数ショットシナリオでの画像分類タスクなどに適しています。

モデル特徴

少数ショット学習
MSN事前学習手法により、モデルは少数ショットや極少数ショットシナリオで卓越した性能を発揮します。
共同埋め込みアーキテクチャ
マスクトークンのプロトタイプと非マスクトークンをマッチングさせる共同埋め込みアーキテクチャを採用し、画像表現を効果的に学習します。
事前学習の利点
事前学習済みモデルは、線形層を追加して画像分類を行うなど、下流タスクに適した特徴を抽出できます。

モデル能力

画像分類
特徴抽出

使用事例

コンピュータビジョン
少数ショット画像分類
アノテーションサンプルが少ない画像分類タスクで、このモデルを使用して効率的に訓練と予測を行います。
少数ショットシナリオで卓越した性能を発揮します。
画像特徴抽出
このモデルを使用して画像特徴を抽出し、後続の機械学習タスクに利用します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase