U

UCF Crime

csr2000によって開発
このモデルはgoogle/vit-base-patch16-224をimagefolderデータセットでファインチューニングしたバージョンで、視覚タスクに適しています。
ダウンロード数 46
リリース時間 : 8/13/2022

モデル概要

これはVision Transformer (ViT)アーキテクチャに基づく視覚モデルで、ファインチューニング後は特定シナリオの画像分析タスクに使用可能です。

モデル特徴

ViTアーキテクチャ採用
Vision Transformerアーキテクチャを採用し、画像データを効果的に処理可能
ファインチューニングモデル
特定データセットでファインチューニングされており、特定タスク向けに最適化されている可能性
中規模モデル
vit-baseモデルを基にしており、性能と計算需要のバランスが取れている

モデル能力

画像分類
視覚的特徴抽出
画像分析

使用事例

セキュリティ監視
異常行動検知
監視カメラ映像中の異常行動識別に使用可能
視覚分析
シーン理解
画像中のシーン内容分析に使用可能
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase