A

Aimv2 1B Patch14 336

appleによって開発
AIMv2はマルチモーダル自己回帰目標で事前学習された視覚モデルシリーズで、複数のマルチモーダル理解ベンチマークで優れた性能を発揮します。
ダウンロード数 52
リリース時間 : 10/29/2024

モデル概要

AIMv2はマルチモーダル自己回帰目標で事前学習された視覚モデルで、強力な画像特徴抽出と分類能力を備えています。

モデル特徴

マルチモーダル自己回帰事前学習
マルチモーダル自己回帰目標で事前学習を行い、マルチモーダル理解タスクでのモデル性能を向上させます。
高性能
複数のベンチマークテストでOAI CLIPやSigLIPを上回り、強力な認識性能を発揮します。
幅広い適用性
ImageNet、CIFAR、Food101など様々なデータセットで優れた性能を示します。

モデル能力

画像特徴抽出
画像分類
マルチモーダル理解

使用事例

コンピュータビジョン
画像分類
画像を分類し、様々なデータセットに適用可能です。
ImageNet-1kで88.7%の精度を達成。
物体検出
オープン語彙物体検出タスクで優れた性能を発揮します。
DINOv2モデルを上回ります。
医療画像
病理画像分析
医療画像データの分析に使用されます。
Camelyon17データセットで94.2%の精度を達成。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase