🚀 yolov8_animeface
YOLOv8を使用したアニメ顔検出
🚀 クイックスタート
このモデルは、YOLOv8をベースにしたアニメ顔検出モデルです。高精度な顔検出を行うことができ、アニメ画像の分析などに役立ちます。
✨ 主な機能
- アニメ画像からの高精度な顔検出
- 既存のモデルと比較して、高い精度と性能を持つ
📦 インストール
このREADMEには具体的なインストール手順が記載されていないため、このセクションをスキップします。
💻 使用例
このREADMEには具体的なコード例が記載されていないため、このセクションをスキップします。
📚 ドキュメント
データセット
データセットは、safebooruから手動でアノテーションされた10,000枚の画像で作成されました。分割は、トレーニング70%、検証20%、テスト10%です。
性能
このモデルはyolov8x6をベースにしています。上記のデータセットで1280px * 1280pxのサイズで300エポックトレーニングされました。RTX A4000でのトレーニングには約110時間かかりました。
私のデータセットでは、デフォルトのパラメータで特に良好な性能を発揮します。
Images Instances Box(P R mAP50 mAP50-95):
1002 1562 0.957 0.924 0.955 0.534
Speed: 1.3ms preprocess, 81.9ms inference, 0.0ms loss, 0.8ms postprocess per image
mAP50 - 95はそれほど高くはありませんが、私がテストしたファイルでは予測が常に正しく行われます。信頼度はもっと高くなる可能性がありますが、モデルは非常に正確です。
テストセットで生成されたモデルの混同行列
テストセットで生成されたモデルのPR曲線
他のメトリクスは./demo/val
サブフォルダにあります。
デモ
手動アノテーション |
yolov8_animeface |
 |
 |
 |
 |
既存のモデルとの比較
異なる世代の2つのモデルを比較することについて議論することはできますが、このモデルをyolov5をベースにしたzymk9のモデルと比較することは興味深いと思います。両方とも同じ目的を持ち、同じ方法でトレーニングされています。
同じデータセットで同じパラメータ(conf = 0.001 & iou = 0.6)では、yolov8x6 - animefaceはyolov5xのモデルよりも良いメトリクスを生成します。
yolov8 - animeface:
Images Instances Box(P R mAP50 mAP50-95):
1002 1562 0.956 0.919 0.953 0.532
Speed: 1.2ms preprocess, 81.2ms inference, 0.0ms loss, 1.0ms postprocess per image
yolov5 - anime:
Images Instances Box(P R mAP50 mAP50-95):
1003 1566 0.778 0.685 0.633 0.232
Speed: 1.5ms pre-process, 85.5ms inference, 1.4ms NMS per image at shape (32, 3, 1280, 1280)
画像を640pxにリサイズした場合、yolov5 - animeはより良い結果を提供しますが、同じパラメータではyolov8 - animefaceに劣ります。
意外なことに、yolov5はyolov8よりもはるかに自信があります。しかし、誤検出もはるかに多くなります。
Yolov8_animeface |
Yolov5_anime |
 |
 |
 |
 |
結論
このモデルは私のデータセットでは非常に良い性能を発揮しますが、あなたのメトリクスは私のものと異なる可能性があります。後日、より軽量なモデルがリリースされるかもしれません。
このモデルは、以下の文献のYOLOv8をベースにしています。
Jocher, G., Chaurasia, A., & Qiu, J. (2023). Ultralytics YOLO (Version 8.0.0) [Computer software]. https://github.com/ultralytics/ultralytics
🔧 技術詳細
このREADMEには具体的な技術詳細が記載されていないため、このセクションをスキップします。
📄 ライセンス
このモデルはAGPL - 3.0ライセンスの下で提供されています。
属性 |
详情 |
モデルタイプ |
物体検出 |
トレーニングデータ |
safebooruから手動でアノテーションされた10,000枚の画像 |