V

Vit Base Railspace

Kasparによって開発
google/vit-base-patch16-224-in21kを微調整したVision Transformerモデルで、評価セットで99.26%の精度を達成
ダウンロード数 18
リリース時間 : 3/13/2023

モデル概要

このモデルは画像分類タスク向けに最適化されたVision Transformerモデルで、特定のデータセットで優れた性能を発揮し、特に高精度分類タスクに適しています。

モデル特徴

高精度
評価セットで99.26%の精度を達成し、優れた性能を発揮
ViTアーキテクチャ採用
Vision Transformerの基本アーキテクチャを採用し、強力な画像特徴抽出能力を有する
効率的な微調整
わずか4エポックのトレーニングで高性能を達成

モデル能力

画像分類
高精度認識
多クラス識別

使用事例

画像分析
地図画像認識
地図画像内の特定要素を識別・分析するのに使用可能
サンプル画像から、モデルが地図画像ブロックを正確に識別できることが確認された
工業品質検査
生産ライン上の製品品質検査に適用可能
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase