A

Aimv2 Huge Patch14 336

appleによって開発
AIMv2はマルチモーダル自己回帰目標で事前学習された視覚モデルシリーズで、複数の視覚理解ベンチマークテストで優れた性能を発揮します。
ダウンロード数 188
リリース時間 : 10/29/2024

モデル概要

AIMv2は効率的な視覚モデルで、マルチモーダル自己回帰目標事前学習手法を採用し、画像分類や特徴抽出タスクに適しています。

モデル特徴

マルチモーダル自己回帰事前学習
革新的なマルチモーダル自己回帰目標で事前学習を行い、モデル性能を向上させます。
優れたベンチマークテスト性能
CLIPやSigLIPなどのモデルを上回る複数の視覚理解ベンチマークテスト結果。
強力な認識性能
ImageNetなどのデータセットで高い精度を達成。

モデル能力

画像分類
画像特徴抽出
マルチモーダル理解

使用事例

コンピュータビジョン
画像分類
画像を分類し、複数のデータセットをサポートします。
ImageNet-1kで88.2%の精度を達成
細粒度分類
特定ドメインの画像を細かく分類します。
Stanford Carsで96.4%の精度を達成
医療画像
病理画像分析
医療画像の分類と分析に使用されます。
Camelyon17で93.3%の精度を達成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase