🚀 AI圖像分類 - Midjourney V6 & SDXL 模型卡片
本模型旨在區分AI生成圖像與人類創作圖像,特別是針對Midjourney V6和Stable Diffusion XL (SDXL)的輸出圖像,為內容審核、事實核查等場景提供了有效的解決方案。
🚀 快速開始
你可以使用🤗 Transformers庫來使用此模型:
from transformers import AutoModelForImageClassification, AutoFeatureExtractor
from PIL import Image
import torch
model_name = "ideepankarsharma2003/AI_ImageClassification_MidjourneyV6_SDXL"
model = AutoModelForImageClassification.from_pretrained(model_name)
feature_extractor = AutoFeatureExtractor.from_pretrained(model_name)
image = Image.open("path_to_image.jpg")
inputs = feature_extractor(images=image, return_tensors="pt")
with torch.no_grad():
outputs = model(**inputs)
logits = outputs.logits
predicted_label = logits.argmax(-1).item()
id2label = {0: "ai_gen", 1: "human"}
print("預測標籤:", id2label[predicted_label])
✨ 主要特性
- 基於Swin Transformer架構,能夠有效區分AI生成和人類創作的圖像。
- 專門針對Midjourney V6和Stable Diffusion XL (SDXL)的輸出圖像進行訓練。
- 可用於內容審核、事實核查和合成媒體檢測等場景。
📦 安裝指南
文檔未提供安裝步驟,可參考🤗 Transformers庫的官方文檔進行安裝。
📚 詳細文檔
模型詳情
模型描述
此模型是一個基於Swin Transformer的分類器,旨在區分AI生成和人類創作的圖像,特別關注Midjourney V6和**Stable Diffusion XL (SDXL)**的輸出。它在經過精心策劃的AI生成圖像數據集上進行了訓練。
屬性 |
詳情 |
開發者 |
Deepankar Sharma |
模型類型 |
圖像分類(Swin Transformer) |
微調基礎模型 |
SwinForImageClassification |
模型來源
用途
直接用途
此模型可用於檢測Midjourney V6和SDXL生成的AI圖像。它適用於內容審核、事實核查和合成媒體檢測。
非適用場景
- 該模型並非設計用於檢測所有生成模型生成的AI圖像。
- 對於經過大量編輯的AI生成圖像或混合了人類元素的圖像,其性能可能不佳。
- 它不用於法醫級別的深度偽造檢測。
偏差、風險和侷限性
此模型專門在Midjourney V6和Stable Diffusion XL數據集上進行訓練。它可能無法很好地泛化到其他AI模型生成的圖像。此外,數據集中的偏差可能導致誤報(將真實圖像標記為AI生成)或漏報(未能檢測到AI生成的內容)。
建議
用戶應使用其他工具驗證結果,不要僅依賴此模型進行高風險決策。在部署之前,應在特定領域的數據集上測試模型性能。
訓練詳情
訓練數據
該模型在以下數據集上進行訓練:
訓練過程
- 圖像大小:224x224
- 補丁大小:4
- 嵌入維度:128
- 層數:4
- 每階段注意力頭數:[4, 8, 16, 32]
- 丟棄率:
- 注意力:0.0
- 隱藏層:0.0
- 隨機丟棄路徑:0.1
- 激活函數:GeLU
- 優化器:AdamW
- 學習率調度器:Cosine Annealing
- 精度:float32
- 訓練步數:3414
評估
測試數據、因素和指標
測試數據
該模型在訓練數據集的單獨驗證分割上進行評估。
指標
總結
該模型能夠有效區分AI生成和人類創作的圖像,但其性能可能會受到數據集偏差和分佈外示例的影響。
引用
如果使用此模型,請引用:
@misc{ai_image_classification,
author = {Deepankar Sharma},
title = {AI Image Classification - Midjourney V6 & SDXL},
year = {2024},
publisher = {Hugging Face},
howpublished = {\url{https://huggingface.co/ideepankarsharma2003/AI_ImageClassification_MidjourneyV6_SDXL}}
}
模型卡片作者