75 Butterfly Types Image Detection
基于Vision Transformer架构的蝴蝶图像分类模型,可识别75种蝴蝶,准确率达96.74%
下载量 27
发布时间 : 10/29/2023
模型简介
使用Google的ViT-base模型微调实现的蝴蝶种类分类器,适用于生态研究和生物多样性监测
模型特点
高精度分类
在75类蝴蝶分类任务中达到96.74%的整体准确率
Vision Transformer架构
采用先进的Transformer架构处理图像,具有优秀的特征提取能力
细粒度识别
能区分外观相似的蝴蝶种类(如不同亚种的灰蝶科)
模型能力
蝴蝶种类识别
图像分类
生物特征提取
使用案例
生态研究
野外蝴蝶种群监测
自动识别野外拍摄的蝴蝶种类
准确记录生物多样性数据
教育应用
昆虫识别APP
集成到移动应用中进行实时蝴蝶识别
帮助学生和自然爱好者识别蝴蝶种类
🚀 蝴蝶图像分类模型
该项目基于预训练模型,能够根据输入的图像识别蝴蝶的种类,准确率约为 97%。对于蝴蝶种类识别感兴趣的用户,该模型提供了一个高效且准确的解决方案。
🚀 快速开始
输入一张蝴蝶的图像,模型即可返回蝴蝶的种类,准确率约为 97%。
更多详细信息请参考:https://www.kaggle.com/code/dima806/75-butterfly-types-image-detection-vit
💻 使用示例
基础用法
以下是一个分类报告示例,展示了模型对不同种类蝴蝶的分类性能:
Classification report:
precision recall f1-score support
GREY HAIRSTREAK 0.9623 0.9808 0.9714 52
COMMON BANDED AWL 0.9804 0.9434 0.9615 53
CHESTNUT 0.9815 1.0000 0.9907 53
EASTERN DAPPLE WHITE 0.9362 0.8462 0.8889 52
COMMON WOOD-NYMPH 0.9123 1.0000 0.9541 52
CLEOPATRA 1.0000 0.9808 0.9903 52
ELBOWED PIERROT 1.0000 0.9808 0.9903 52
MILBERTS TORTOISESHELL 0.9434 0.9434 0.9434 53
PEACOCK 1.0000 1.0000 1.0000 52
MALACHITE 1.0000 1.0000 1.0000 52
RED ADMIRAL 0.9423 0.9245 0.9333 53
INDRA SWALLOW 0.9804 0.9615 0.9709 52
MOURNING CLOAK 1.0000 0.9808 0.9903 52
CRECENT 1.0000 0.9808 0.9903 52
AN 88 1.0000 1.0000 1.0000 52
BECKERS WHITE 0.9455 1.0000 0.9720 52
ATALA 1.0000 1.0000 1.0000 52
PURPLISH COPPER 0.9259 0.9615 0.9434 52
SILVER SPOT SKIPPER 0.9286 1.0000 0.9630 52
ZEBRA LONG WING 1.0000 1.0000 1.0000 52
RED POSTMAN 0.9455 1.0000 0.9720 52
TROPICAL LEAFWING 0.9623 0.9808 0.9714 52
JULIA 0.9444 0.9808 0.9623 52
DANAID EGGFLY 0.9767 0.8077 0.8842 52
AMERICAN SNOOT 0.9615 0.9434 0.9524 53
BANDED ORANGE HELICONIAN 0.9800 0.9245 0.9515 53
ULYSES 1.0000 0.9623 0.9808 53
LARGE MARBLE 0.9057 0.9231 0.9143 52
RED SPOTTED PURPLE 0.9811 1.0000 0.9905 52
EASTERN PINE ELFIN 0.9636 1.0000 0.9815 53
ADONIS 0.9811 0.9811 0.9811 53
CLOUDED SULPHUR 0.8519 0.8679 0.8598 53
CABBAGE WHITE 0.9630 1.0000 0.9811 52
BLUE SPOTTED CROW 1.0000 0.9808 0.9903 52
GOLD BANDED 0.9815 1.0000 0.9907 53
VICEROY 1.0000 0.9811 0.9905 53
MANGROVE SKIPPER 0.9804 0.9615 0.9709 52
MESTRA 1.0000 0.9038 0.9495 52
CAIRNS BIRDWING 1.0000 1.0000 1.0000 53
BLACK HAIRSTREAK 0.9800 0.9423 0.9608 52
PAPER KITE 1.0000 1.0000 1.0000 52
ORCHARD SWALLOW 0.9615 0.9615 0.9615 52
ORANGE OAKLEAF 1.0000 1.0000 1.0000 52
PIPEVINE SWALLOW 1.0000 1.0000 1.0000 52
SCARCE SWALLOW 0.9811 0.9811 0.9811 53
PURPLE HAIRSTREAK 0.9615 0.9434 0.9524 53
PAINTED LADY 0.9630 1.0000 0.9811 52
EASTERN COMA 0.8033 0.9423 0.8673 52
CHECQUERED SKIPPER 1.0000 0.8846 0.9388 52
SOUTHERN DOGFACE 0.9057 0.9057 0.9057 53
CRIMSON PATCH 1.0000 1.0000 1.0000 52
YELLOW SWALLOW TAIL 0.9464 1.0000 0.9725 53
POPINJAY 1.0000 1.0000 1.0000 53
BLUE MORPHO 0.9811 1.0000 0.9905 52
COPPER TAIL 0.9184 0.8654 0.8911 52
BROWN SIPROETA 0.9811 1.0000 0.9905 52
GREEN CELLED CATTLEHEART 1.0000 0.9623 0.9808 53
PINE WHITE 1.0000 0.9808 0.9903 52
WOOD SATYR 0.9630 0.9811 0.9720 53
QUESTION MARK 0.9302 0.7692 0.8421 52
RED CRACKER 1.0000 0.9808 0.9903 52
ORANGE TIP 0.9815 1.0000 0.9907 53
SLEEPY ORANGE 0.9623 0.9623 0.9623 53
AFRICAN GIANT SWALLOWTAIL 1.0000 0.9811 0.9905 53
BANDED PEACOCK 1.0000 1.0000 1.0000 53
GREAT EGGFLY 0.8387 1.0000 0.9123 52
SOOTYWING 0.9630 0.9811 0.9720 53
IPHICLUS SISTER 1.0000 1.0000 1.0000 53
TWO BARRED FLASHER 0.9298 1.0000 0.9636 53
CLODIUS PARNASSIAN 0.9811 1.0000 0.9905 52
APPOLLO 0.9811 0.9811 0.9811 53
MONARCH 0.9811 1.0000 0.9905 52
STRAITED QUEEN 0.9630 1.0000 0.9811 52
METALMARK 0.9600 0.9057 0.9320 53
GREAT JAY 1.0000 0.9623 0.9808 53
accuracy 0.9674 3930
macro avg 0.9685 0.9674 0.9673 3930
weighted avg 0.9685 0.9674 0.9673 3930
📄 许可证
本项目采用 Apache-2.0 许可证。
📋 模型信息
属性 | 详情 |
---|---|
模型类型 | 基于预训练模型 google/vit-base-patch16-224-in21k 微调的图像分类模型 |
评估指标 | 准确率、F1值 |
Nsfw Image Detection
Apache-2.0
基于ViT架构的NSFW图像分类模型,通过监督学习在ImageNet-21k数据集上预训练,并在80,000张图像上微调,用于区分正常和NSFW内容。
图像分类
Transformers

N
Falconsai
82.4M
588
Fairface Age Image Detection
Apache-2.0
基于Vision Transformer架构的图像分类模型,在ImageNet-21k数据集上预训练,适用于多类别图像分类任务
图像分类
Transformers

F
dima806
76.6M
10
Dinov2 Small
Apache-2.0
基于DINOv2方法训练的小尺寸视觉Transformer模型,通过自监督学习提取图像特征
图像分类
Transformers

D
facebook
5.0M
31
Vit Base Patch16 224
Apache-2.0
基于ImageNet-21k预训练和ImageNet微调的视觉变换器模型,用于图像分类任务
图像分类
V
google
4.8M
775
Vit Base Patch16 224 In21k
Apache-2.0
基于ImageNet-21k数据集预训练的视觉Transformer模型,用于图像分类任务。
图像分类
V
google
2.2M
323
Dinov2 Base
Apache-2.0
基于DINOv2方法训练的视觉Transformer模型,通过自监督学习提取图像特征
图像分类
Transformers

D
facebook
1.9M
126
Gender Classification
一个基于PyTorch和HuggingPics构建的图像分类模型,用于识别图像中的性别
图像分类
Transformers

G
rizvandwiki
1.8M
48
Vit Base Nsfw Detector
Apache-2.0
基于Vision Transformer (ViT)架构的图像分类模型,专门用于检测图像是否包含NSFW(不安全)内容。
图像分类
Transformers

V
AdamCodd
1.2M
47
Vit Hybrid Base Bit 384
Apache-2.0
混合视觉变换器(ViT)模型结合了卷积网络和Transformer架构,用于图像分类任务,在ImageNet上表现出色。
图像分类
Transformers

V
google
992.28k
6
Gender Classification 2
这是一个基于PyTorch框架和HuggingPics工具生成的图像分类模型,专门用于性别分类任务。
图像分类
Transformers

G
rizvandwiki
906.98k
32
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers 支持多种语言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers 英语

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统 中文
R
uer
2,694
98