Vit Base Blur
このモデルは、google/vit-base-patch16-224-in21kをぼやけた画像データセットでファインチューニングしたバージョンで、ぼやけた画像と鮮明な画像を区別するために使用されます。
ダウンロード数 92
リリース時間 : 7/5/2023
モデル概要
このモデルは、'ノイズ'(ぼやけた)画像と鮮明な画像を区別する二値分類タスクに使用され、'ノイズ'画像はLDM(潜在拡散モデル)が画像生成プロセスで未完成または反復回数が不足している結果です。
モデル特徴
高精度
評価セットで1.0の精度を達成し、ぼやけた画像と鮮明な画像を効果的に区別できます。
ViTアーキテクチャベース
Vision Transformer (ViT)アーキテクチャを採用し、強力な画像処理能力を備えています。
少数サンプルでのファインチューニング
約1000枚の画像のみを使用してファインチューニングを行い、優れた性能を達成できます。
モデル能力
画像分類
ぼやけた画像検出
二値分類タスク
使用事例
画像品質検出
生成画像品質評価
LDMで生成された画像が十分な鮮明度に達しているかどうかを評価するために使用されます
30ステップと10ステップで生成された画像を正確に区別
画像前処理
ぼやけた画像の自動フィルタリング
画像処理プロセスで低品質な画像を自動的に識別しフィルタリングします
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98