B

Beit Base Patch16 224 Pt22k Ft22k Finetuned FER2013 9e 05

lixiqiによって開発
BEiTアーキテクチャに基づくビジョントランスフォーマーモデルで、FER2013データセットでファインチューニングされ、表情認識タスク用
ダウンロード数 19
リリース時間 : 1/8/2023

モデル概要

このモデルはマイクロソフトのBEiTアーキテクチャに基づくビジョントランスフォーマーで、表情認識タスクに特化してファインチューニングされ、FER2013データセットで68.4%の精度を達成

モデル特徴

BEiTアーキテクチャ採用
BEiT(Bidirectional Encoder representation for Image Transformers)アーキテクチャを採用し、ビジョントランスフォーマーの利点を組み合わせている
表情認識
表情認識タスクに特化して最適化されており、様々な表情を認識可能
効率的なファインチューニング
事前学習モデルを基に9e-05の学習率で精密にファインチューニングし、トレーニング効率とモデル性能のバランスを取っている

モデル能力

表情分類
画像特徴抽出
感情認識

使用事例

感情コンピューティング
リアルタイム表情分析
ビデオ会議やソーシャルメディアでのリアルタイム表情認識に使用
様々な基本表情を認識可能、精度68.4%
ヒューマンコンピュータインタラクション
スマートデバイスにユーザーの感情フィードバックを提供
心理学研究
感情反応研究
心理学実験での自動表情分析に使用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase