75 Butterfly Types Image Detection
Vision Transformerアーキテクチャに基づく蝶画像分類モデル。75種の蝶を識別可能で、精度は96.74%
ダウンロード数 27
リリース時間 : 10/29/2023
モデル概要
GoogleのViT-baseモデルをファインチューニングした蝶種分類器。生態研究や生物多様性モニタリングに適応
モデル特徴
高精度分類
75クラスの蝶分類タスクで96.74%の全体精度を達成
Vision Transformerアーキテクチャ
先進的なTransformerアーキテクチャを採用し、優れた特徴抽出能力を有する
細粒度識別
外観が類似した蝶種(例えば異なる亜種のシジミチョウ科)を区別可能
モデル能力
蝶種識別
画像分類
生物特徴抽出
使用事例
生態研究
野外蝶個体群モニタリング
野外で撮影した蝶種を自動識別
生物多様性データを正確に記録
教育応用
昆虫識別アプリ
モバイルアプリに統合してリアルタイム蝶識別を実現
学生や自然愛好家が蝶種を識別するのを支援
🚀 蝶種識別モデル
このモデルは画像から蝶の種類を約97%の精度で識別します。詳細については、こちらのKaggleノートブックを参照してください。
📚 詳細ドキュメント
メトリクス
- 精度 (Accuracy)
- F1スコア (F1-score)
ベースモデル
google/vit-base-patch16-224-in21k
分類レポート
Classification report:
precision recall f1-score support
GREY HAIRSTREAK 0.9623 0.9808 0.9714 52
COMMON BANDED AWL 0.9804 0.9434 0.9615 53
CHESTNUT 0.9815 1.0000 0.9907 53
EASTERN DAPPLE WHITE 0.9362 0.8462 0.8889 52
COMMON WOOD-NYMPH 0.9123 1.0000 0.9541 52
CLEOPATRA 1.0000 0.9808 0.9903 52
ELBOWED PIERROT 1.0000 0.9808 0.9903 52
MILBERTS TORTOISESHELL 0.9434 0.9434 0.9434 53
PEACOCK 1.0000 1.0000 1.0000 52
MALACHITE 1.0000 1.0000 1.0000 52
RED ADMIRAL 0.9423 0.9245 0.9333 53
INDRA SWALLOW 0.9804 0.9615 0.9709 52
MOURNING CLOAK 1.0000 0.9808 0.9903 52
CRECENT 1.0000 0.9808 0.9903 52
AN 88 1.0000 1.0000 1.0000 52
BECKERS WHITE 0.9455 1.0000 0.9720 52
ATALA 1.0000 1.0000 1.0000 52
PURPLISH COPPER 0.9259 0.9615 0.9434 52
SILVER SPOT SKIPPER 0.9286 1.0000 0.9630 52
ZEBRA LONG WING 1.0000 1.0000 1.0000 52
RED POSTMAN 0.9455 1.0000 0.9720 52
TROPICAL LEAFWING 0.9623 0.9808 0.9714 52
JULIA 0.9444 0.9808 0.9623 52
DANAID EGGFLY 0.9767 0.8077 0.8842 52
AMERICAN SNOOT 0.9615 0.9434 0.9524 53
BANDED ORANGE HELICONIAN 0.9800 0.9245 0.9515 53
ULYSES 1.0000 0.9623 0.9808 53
LARGE MARBLE 0.9057 0.9231 0.9143 52
RED SPOTTED PURPLE 0.9811 1.0000 0.9905 52
EASTERN PINE ELFIN 0.9636 1.0000 0.9815 53
ADONIS 0.9811 0.9811 0.9811 53
CLOUDED SULPHUR 0.8519 0.8679 0.8598 53
CABBAGE WHITE 0.9630 1.0000 0.9811 52
BLUE SPOTTED CROW 1.0000 0.9808 0.9903 52
GOLD BANDED 0.9815 1.0000 0.9907 53
VICEROY 1.0000 0.9811 0.9905 53
MANGROVE SKIPPER 0.9804 0.9615 0.9709 52
MESTRA 1.0000 0.9038 0.9495 52
CAIRNS BIRDWING 1.0000 1.0000 1.0000 53
BLACK HAIRSTREAK 0.9800 0.9423 0.9608 52
PAPER KITE 1.0000 1.0000 1.0000 52
ORCHARD SWALLOW 0.9615 0.9615 0.9615 52
ORANGE OAKLEAF 1.0000 1.0000 1.0000 52
PIPEVINE SWALLOW 1.0000 1.0000 1.0000 52
SCARCE SWALLOW 0.9811 0.9811 0.9811 53
PURPLE HAIRSTREAK 0.9615 0.9434 0.9524 53
PAINTED LADY 0.9630 1.0000 0.9811 52
EASTERN COMA 0.8033 0.9423 0.8673 52
CHECQUERED SKIPPER 1.0000 0.8846 0.9388 52
SOUTHERN DOGFACE 0.9057 0.9057 0.9057 53
CRIMSON PATCH 1.0000 1.0000 1.0000 52
YELLOW SWALLOW TAIL 0.9464 1.0000 0.9725 53
POPINJAY 1.0000 1.0000 1.0000 53
BLUE MORPHO 0.9811 1.0000 0.9905 52
COPPER TAIL 0.9184 0.8654 0.8911 52
BROWN SIPROETA 0.9811 1.0000 0.9905 52
GREEN CELLED CATTLEHEART 1.0000 0.9623 0.9808 53
PINE WHITE 1.0000 0.9808 0.9903 52
WOOD SATYR 0.9630 0.9811 0.9720 53
QUESTION MARK 0.9302 0.7692 0.8421 52
RED CRACKER 1.0000 0.9808 0.9903 52
ORANGE TIP 0.9815 1.0000 0.9907 53
SLEEPY ORANGE 0.9623 0.9623 0.9623 53
AFRICAN GIANT SWALLOWTAIL 1.0000 0.9811 0.9905 53
BANDED PEACOCK 1.0000 1.0000 1.0000 53
GREAT EGGFLY 0.8387 1.0000 0.9123 52
SOOTYWING 0.9630 0.9811 0.9720 53
IPHICLUS SISTER 1.0000 1.0000 1.0000 53
TWO BARRED FLASHER 0.9298 1.0000 0.9636 53
CLODIUS PARNASSIAN 0.9811 1.0000 0.9905 52
APPOLLO 0.9811 0.9811 0.9811 53
MONARCH 0.9811 1.0000 0.9905 52
STRAITED QUEEN 0.9630 1.0000 0.9811 52
METALMARK 0.9600 0.9057 0.9320 53
GREAT JAY 1.0000 0.9623 0.9808 53
accuracy 0.9674 3930
macro avg 0.9685 0.9674 0.9673 3930
weighted avg 0.9685 0.9674 0.9673 3930
📄 ライセンス
このプロジェクトはApache License 2.0の下でライセンスされています。
Nsfw Image Detection
Apache-2.0
ViTアーキテクチャに基づくNSFW画像分類モデル。ImageNet-21kデータセットで事前学習し、80,000枚の画像でファインチューニングされ、通常コンテンツとNSFWコンテンツを区別します。
画像分類
Transformers

N
Falconsai
82.4M
588
Fairface Age Image Detection
Apache-2.0
Vision Transformerアーキテクチャに基づく画像分類モデルで、ImageNet-21kデータセットで事前学習されており、多クラス画像分類タスクに適しています
画像分類
Transformers

F
dima806
76.6M
10
Dinov2 Small
Apache-2.0
DINOv2手法でトレーニングされた小型視覚Transformerモデル、自己教師あり学習で画像特徴を抽出
画像分類
Transformers

D
facebook
5.0M
31
Vit Base Patch16 224
Apache-2.0
ImageNet - 21kで事前学習し、ImageNetでファインチューニングしたビジュアルトランスフォーマーモデルで、画像分類タスクに使用されます。
画像分類
V
google
4.8M
775
Vit Base Patch16 224 In21k
Apache-2.0
ImageNet - 21kデータセットを使って事前学習されたビジュアルTransformerモデルで、画像分類タスクに使用されます。
画像分類
V
google
2.2M
323
Dinov2 Base
Apache-2.0
DINOv2手法でトレーニングされた視覚Transformerモデル、自己教師あり学習で画像特徴を抽出
画像分類
Transformers

D
facebook
1.9M
126
Gender Classification
PyTorchとHuggingPicsを使用して構築された画像分類モデルで、画像内の性別を識別します
画像分類
Transformers

G
rizvandwiki
1.8M
48
Vit Base Nsfw Detector
Apache-2.0
Vision Transformer (ViT)アーキテクチャに基づく画像分類モデルで、画像がNSFW(不適切)コンテンツを含むかどうかを検出するために特別に設計されています。
画像分類
Transformers

V
AdamCodd
1.2M
47
Vit Hybrid Base Bit 384
Apache-2.0
ハイブリッドビジョントランスフォーマー(ViT)モデルは、畳み込みネットワークとTransformerアーキテクチャを組み合わせたもので、画像分類タスクにおいてImageNetで優れた性能を発揮します。
画像分類
Transformers

V
google
992.28k
6
Gender Classification 2
これはPyTorchフレームワークとHuggingPicsツールで生成された画像分類モデルで、性別分類タスク専用です。
画像分類
Transformers

G
rizvandwiki
906.98k
32
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98