L

Levit 128

facebookによって開発
LeViT-128は視覚Transformerアーキテクチャに基づく画像分類モデルで、畳み込みネットワークの利点を組み合わせて効率的な推論を実現します。
ダウンロード数 44
リリース時間 : 6/1/2022

モデル概要

LeViT-128モデルはImageNet-1kデータセットで224x224解像度で事前学習されており、画像を1,000のクラスに分類できます。

モデル特徴

効率的な推論
畳み込みネットワークの利点を組み合わせることで、従来の視覚Transformerよりも高速な推論を実現
混合アーキテクチャ
Transformerと畳み込みネットワークを革新的に組み合わせ、両者の利点を兼ね備える

モデル能力

画像分類
視覚的特徴抽出

使用事例

コンピュータビジョン
物体認識
画像中の物体のカテゴリを識別
ImageNetの1,000クラスを正確に分類可能
視覚的コンテンツ分析
画像内容を分析し特徴を抽出
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase