V

Vit Base Blur

Developed by WT-MM
該模型是基於google/vit-base-patch16-224-in21k在模糊圖像數據集上微調的版本,用於區分模糊圖像和清晰圖像。
Downloads 92
Release Time : 7/5/2023

Model Overview

該模型用於二分類任務,區分'噪聲'(模糊)圖像和清晰圖像,其中'噪聲'圖像是LDM(潛在擴散模型)在圖像生成過程中未完成或迭代次數不足的結果。

Model Features

高準確率
在評估集上取得了1.0的準確率,能夠有效區分模糊和清晰圖像。
基於ViT架構
採用Vision Transformer (ViT)架構,具有強大的圖像處理能力。
小樣本微調
僅使用約1000張圖像進行微調,即可達到優異性能。

Model Capabilities

圖像分類
模糊圖像檢測
二分類任務

Use Cases

圖像質量檢測
生成圖像質量評估
用於評估LDM生成的圖像是否達到足夠的清晰度
準確區分30步和10步生成的圖像
圖像預處理
自動過濾模糊圖像
在圖像處理流程中自動識別並過濾低質量圖像
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase