B

Beit Base Patch16 224 Pt22k Ft22k Finetuned FER2013 9e 05

由 lixiqi 开发
基于BEiT架构的视觉Transformer模型,在FER2013数据集上微调,用于面部表情识别任务
下载量 19
发布时间 : 1/8/2023

模型简介

该模型是基于微软BEiT架构的视觉Transformer,专门针对面部表情识别任务进行了微调,在FER2013数据集上取得了68.4%的准确率

模型特点

基于BEiT架构
采用BEiT(Bidirectional Encoder representation for Image Transformers)架构,结合了视觉Transformer的优势
面部表情识别
专门针对面部表情识别任务进行了优化,能够识别多种面部表情
高效微调
在预训练模型基础上使用9e-05的学习率进行精细微调,平衡了训练效率和模型性能

模型能力

面部表情分类
图像特征提取
情感识别

使用案例

情感计算
实时表情分析
用于视频会议或社交媒体中的实时表情识别
可识别多种基本表情,准确率68.4%
人机交互
为智能设备提供用户情绪反馈
心理学研究
情绪反应研究
用于心理学实验中的面部表情自动分析
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase