A

Aimv2 3B Patch14 224

appleによって開発
AIMv2はマルチモーダル自己回帰目標で事前学習された視覚モデルシリーズで、多くのベンチマークテストで優れた性能を発揮
ダウンロード数 57
リリース時間 : 10/29/2024

モデル概要

AIMv2は強力な視覚モデルで、マルチモーダル自己回帰目標で事前学習され、画像分類と理解タスクで優れた性能を示す

モデル特徴

マルチモーダル自己回帰事前学習
革新的なマルチモーダル自己回帰目標を用いた事前学習により、モデルの理解能力を向上
卓越した分類性能
ImageNetなど多くのベンチマークテストでトップクラスの精度を達成
大規模パラメータ
3Bパラメータの強力なモデルで、より豊富な視覚特徴を捉えることが可能

モデル能力

画像特徴抽出
画像分類
マルチモーダル理解
開放語彙物体検出
指示表現理解

使用事例

コンピュータビジョン
汎用画像分類
ImageNetなどの標準データセットでの画像分類
ImageNet-1k精度88.5%
細粒度分類
stanford-carsなどの細粒度分類タスクへの応用
stanford-cars精度96.5%
医療画像分析
camelyon17などの医療画像データセットへの応用
camelyon17精度93.5%
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase