75 Butterfly Types Image Detection
基於Vision Transformer架構的蝴蝶圖像分類模型,可識別75種蝴蝶,準確率達96.74%
下載量 27
發布時間 : 10/29/2023
模型概述
使用Google的ViT-base模型微調實現的蝴蝶種類分類器,適用於生態研究和生物多樣性監測
模型特點
高精度分類
在75類蝴蝶分類任務中達到96.74%的整體準確率
Vision Transformer架構
採用先進的Transformer架構處理圖像,具有優秀的特徵提取能力
細粒度識別
能區分外觀相似的蝴蝶種類(如不同亞種的灰蝶科)
模型能力
蝴蝶種類識別
圖像分類
生物特徵提取
使用案例
生態研究
野外蝴蝶種群監測
自動識別野外拍攝的蝴蝶種類
準確記錄生物多樣性數據
教育應用
昆蟲識別APP
集成到移動應用中進行即時蝴蝶識別
幫助學生和自然愛好者識別蝴蝶種類
🚀 蝴蝶圖像分類模型
該項目基於預訓練模型,能夠根據輸入的圖像識別蝴蝶的種類,準確率約為 97%。對於蝴蝶種類識別感興趣的用戶,該模型提供了一個高效且準確的解決方案。
🚀 快速開始
輸入一張蝴蝶的圖像,模型即可返回蝴蝶的種類,準確率約為 97%。
更多詳細信息請參考:https://www.kaggle.com/code/dima806/75-butterfly-types-image-detection-vit
💻 使用示例
基礎用法
以下是一個分類報告示例,展示了模型對不同種類蝴蝶的分類性能:
Classification report:
precision recall f1-score support
GREY HAIRSTREAK 0.9623 0.9808 0.9714 52
COMMON BANDED AWL 0.9804 0.9434 0.9615 53
CHESTNUT 0.9815 1.0000 0.9907 53
EASTERN DAPPLE WHITE 0.9362 0.8462 0.8889 52
COMMON WOOD-NYMPH 0.9123 1.0000 0.9541 52
CLEOPATRA 1.0000 0.9808 0.9903 52
ELBOWED PIERROT 1.0000 0.9808 0.9903 52
MILBERTS TORTOISESHELL 0.9434 0.9434 0.9434 53
PEACOCK 1.0000 1.0000 1.0000 52
MALACHITE 1.0000 1.0000 1.0000 52
RED ADMIRAL 0.9423 0.9245 0.9333 53
INDRA SWALLOW 0.9804 0.9615 0.9709 52
MOURNING CLOAK 1.0000 0.9808 0.9903 52
CRECENT 1.0000 0.9808 0.9903 52
AN 88 1.0000 1.0000 1.0000 52
BECKERS WHITE 0.9455 1.0000 0.9720 52
ATALA 1.0000 1.0000 1.0000 52
PURPLISH COPPER 0.9259 0.9615 0.9434 52
SILVER SPOT SKIPPER 0.9286 1.0000 0.9630 52
ZEBRA LONG WING 1.0000 1.0000 1.0000 52
RED POSTMAN 0.9455 1.0000 0.9720 52
TROPICAL LEAFWING 0.9623 0.9808 0.9714 52
JULIA 0.9444 0.9808 0.9623 52
DANAID EGGFLY 0.9767 0.8077 0.8842 52
AMERICAN SNOOT 0.9615 0.9434 0.9524 53
BANDED ORANGE HELICONIAN 0.9800 0.9245 0.9515 53
ULYSES 1.0000 0.9623 0.9808 53
LARGE MARBLE 0.9057 0.9231 0.9143 52
RED SPOTTED PURPLE 0.9811 1.0000 0.9905 52
EASTERN PINE ELFIN 0.9636 1.0000 0.9815 53
ADONIS 0.9811 0.9811 0.9811 53
CLOUDED SULPHUR 0.8519 0.8679 0.8598 53
CABBAGE WHITE 0.9630 1.0000 0.9811 52
BLUE SPOTTED CROW 1.0000 0.9808 0.9903 52
GOLD BANDED 0.9815 1.0000 0.9907 53
VICEROY 1.0000 0.9811 0.9905 53
MANGROVE SKIPPER 0.9804 0.9615 0.9709 52
MESTRA 1.0000 0.9038 0.9495 52
CAIRNS BIRDWING 1.0000 1.0000 1.0000 53
BLACK HAIRSTREAK 0.9800 0.9423 0.9608 52
PAPER KITE 1.0000 1.0000 1.0000 52
ORCHARD SWALLOW 0.9615 0.9615 0.9615 52
ORANGE OAKLEAF 1.0000 1.0000 1.0000 52
PIPEVINE SWALLOW 1.0000 1.0000 1.0000 52
SCARCE SWALLOW 0.9811 0.9811 0.9811 53
PURPLE HAIRSTREAK 0.9615 0.9434 0.9524 53
PAINTED LADY 0.9630 1.0000 0.9811 52
EASTERN COMA 0.8033 0.9423 0.8673 52
CHECQUERED SKIPPER 1.0000 0.8846 0.9388 52
SOUTHERN DOGFACE 0.9057 0.9057 0.9057 53
CRIMSON PATCH 1.0000 1.0000 1.0000 52
YELLOW SWALLOW TAIL 0.9464 1.0000 0.9725 53
POPINJAY 1.0000 1.0000 1.0000 53
BLUE MORPHO 0.9811 1.0000 0.9905 52
COPPER TAIL 0.9184 0.8654 0.8911 52
BROWN SIPROETA 0.9811 1.0000 0.9905 52
GREEN CELLED CATTLEHEART 1.0000 0.9623 0.9808 53
PINE WHITE 1.0000 0.9808 0.9903 52
WOOD SATYR 0.9630 0.9811 0.9720 53
QUESTION MARK 0.9302 0.7692 0.8421 52
RED CRACKER 1.0000 0.9808 0.9903 52
ORANGE TIP 0.9815 1.0000 0.9907 53
SLEEPY ORANGE 0.9623 0.9623 0.9623 53
AFRICAN GIANT SWALLOWTAIL 1.0000 0.9811 0.9905 53
BANDED PEACOCK 1.0000 1.0000 1.0000 53
GREAT EGGFLY 0.8387 1.0000 0.9123 52
SOOTYWING 0.9630 0.9811 0.9720 53
IPHICLUS SISTER 1.0000 1.0000 1.0000 53
TWO BARRED FLASHER 0.9298 1.0000 0.9636 53
CLODIUS PARNASSIAN 0.9811 1.0000 0.9905 52
APPOLLO 0.9811 0.9811 0.9811 53
MONARCH 0.9811 1.0000 0.9905 52
STRAITED QUEEN 0.9630 1.0000 0.9811 52
METALMARK 0.9600 0.9057 0.9320 53
GREAT JAY 1.0000 0.9623 0.9808 53
accuracy 0.9674 3930
macro avg 0.9685 0.9674 0.9673 3930
weighted avg 0.9685 0.9674 0.9673 3930
📄 許可證
本項目採用 Apache-2.0 許可證。
📋 模型信息
屬性 | 詳情 |
---|---|
模型類型 | 基於預訓練模型 google/vit-base-patch16-224-in21k 微調的圖像分類模型 |
評估指標 | 準確率、F1值 |
Nsfw Image Detection
Apache-2.0
基於ViT架構的NSFW圖像分類模型,通過監督學習在ImageNet-21k數據集上預訓練,並在80,000張圖像上微調,用於區分正常和NSFW內容。
圖像分類
Transformers

N
Falconsai
82.4M
588
Fairface Age Image Detection
Apache-2.0
基於Vision Transformer架構的圖像分類模型,在ImageNet-21k數據集上預訓練,適用於多類別圖像分類任務
圖像分類
Transformers

F
dima806
76.6M
10
Dinov2 Small
Apache-2.0
基於DINOv2方法訓練的小尺寸視覺Transformer模型,通過自監督學習提取圖像特徵
圖像分類
Transformers

D
facebook
5.0M
31
Vit Base Patch16 224
Apache-2.0
基於ImageNet-21k預訓練和ImageNet微調的視覺變換器模型,用於圖像分類任務
圖像分類
V
google
4.8M
775
Vit Base Patch16 224 In21k
Apache-2.0
基於ImageNet-21k數據集預訓練的視覺Transformer模型,用於圖像分類任務。
圖像分類
V
google
2.2M
323
Dinov2 Base
Apache-2.0
基於DINOv2方法訓練的視覺Transformer模型,通過自監督學習提取圖像特徵
圖像分類
Transformers

D
facebook
1.9M
126
Gender Classification
一個基於PyTorch和HuggingPics構建的圖像分類模型,用於識別圖像中的性別
圖像分類
Transformers

G
rizvandwiki
1.8M
48
Vit Base Nsfw Detector
Apache-2.0
基於Vision Transformer (ViT)架構的圖像分類模型,專門用於檢測圖像是否包含NSFW(不安全)內容。
圖像分類
Transformers

V
AdamCodd
1.2M
47
Vit Hybrid Base Bit 384
Apache-2.0
混合視覺變換器(ViT)模型結合了卷積網絡和Transformer架構,用於圖像分類任務,在ImageNet上表現出色。
圖像分類
Transformers

V
google
992.28k
6
Gender Classification 2
這是一個基於PyTorch框架和HuggingPics工具生成的圖像分類模型,專門用於性別分類任務。
圖像分類
Transformers

G
rizvandwiki
906.98k
32
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98