V

Vit Base Blur

WT-MMによって開発
このモデルは、google/vit-base-patch16-224-in21kをぼやけた画像データセットでファインチューニングしたバージョンで、ぼやけた画像と鮮明な画像を区別するために使用されます。
ダウンロード数 92
リリース時間 : 7/5/2023

モデル概要

このモデルは、'ノイズ'(ぼやけた)画像と鮮明な画像を区別する二値分類タスクに使用され、'ノイズ'画像はLDM(潜在拡散モデル)が画像生成プロセスで未完成または反復回数が不足している結果です。

モデル特徴

高精度
評価セットで1.0の精度を達成し、ぼやけた画像と鮮明な画像を効果的に区別できます。
ViTアーキテクチャベース
Vision Transformer (ViT)アーキテクチャを採用し、強力な画像処理能力を備えています。
少数サンプルでのファインチューニング
約1000枚の画像のみを使用してファインチューニングを行い、優れた性能を達成できます。

モデル能力

画像分類
ぼやけた画像検出
二値分類タスク

使用事例

画像品質検出
生成画像品質評価
LDMで生成された画像が十分な鮮明度に達しているかどうかを評価するために使用されます
30ステップと10ステップで生成された画像を正確に区別
画像前処理
ぼやけた画像の自動フィルタリング
画像処理プロセスで低品質な画像を自動的に識別しフィルタリングします
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase