I

Indian Sign Language Classification

Hemgによって開発
Google Vision Transformer (ViT)アーキテクチャを基にファインチューニングしたインド手話画像分類モデルで、精度は99.05%
ダウンロード数 167
リリース時間 : 3/15/2024

モデル概要

このモデルはインド手話認識用の視覚分類モデルで、事前学習済みViTアーキテクチャを基にファインチューニングされ、手話画像認識に特化しています

モデル特徴

高精度
評価データセットで99.05%の分類精度を達成
ViTアーキテクチャ採用
Vision Transformerアーキテクチャを使用し、画像分類タスクに適しています
ファインチューニングモデル
google/vit-base-patch16-224-in21k事前学習モデルを基にファインチューニング

モデル能力

手話画像分類
視覚特徴抽出
多クラス画像認識

使用事例

アクセシビリティ技術
手話翻訳システム
リアルタイム手話認識・翻訳システム構築に使用
高精度な手話分類
教育支援ツール
聴覚障害者の学習・コミュニケーションを支援する手話認識ツール
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase