🚀 DeQA-Score-Mix3
DeQA-Score 是一個圖像質量評估模型,其權重在 KonIQ、SPAQ 和 KADID 數據集上進行了全量微調。本項目提供了該模型的相關代碼、論文以及項目頁面鏈接,方便研究人員和開發者使用。
🚀 快速開始
使用 AutoModel 快速啟動
對於這張圖片:
,使用 transformers==4.36.1
啟動一個 AutoModel 評分器:
import requests
import torch
from transformers import AutoModelForCausalLM
model = AutoModelForCausalLM.from_pretrained(
"zhiyuanyou/DeQA-Score-Mix3",
trust_remote_code=True,
attn_implementation="eager",
torch_dtype=torch.float16,
device_map="auto",
)
from PIL import Image
score = model.score(
[Image.open(requests.get(
"https://raw.githubusercontent.com/zhiyuanyou/DeQA-Score/main/fig/singapore_flyer.jpg", stream=True
).raw)]
)
“score” 的結果應該是 1.9404(範圍在 [1,5] 內,值越高越好)。
💻 使用示例
基礎用法
上述快速開始部分的代碼即為基礎用法示例,展示瞭如何使用 transformers
庫加載預訓練模型並對單張圖像進行質量評分。
📚 詳細文檔
無參考圖像質量評估結果(PLCC / SRCC)
數據集 |
KonIQ |
SPAQ |
KADID |
PIPAL |
LIVE-Wild |
AGIQA |
TID2013 |
CSIQ |
Q-Align (基線) |
0.945 / 0.938 |
0.933 / 0.931 |
0.935 / 0.934 |
0.409 / 0.420 |
0.887 / 0.883 |
0.788 / 0.733 |
0.829 / 0.808 |
0.876 / 0.845 |
DeQA-Score (我們的方法) |
0.956 / 0.943 |
0.938 / 0.934 |
0.955 / 0.953 |
0.495 / 0.496 |
0.900 / 0.887 |
0.808 / 0.745 |
0.852 / 0.820 |
0.900 / 0.857 |
引用信息
如果您發現我們的工作對您的研究和應用有幫助,請使用以下 BibTeX 進行引用:
@inproceedings{deqa_score,
title={Teaching Large Language Models to Regress Accurate Image Quality Scores using Score Distribution},
author={You, Zhiyuan and Cai, Xin and Gu, Jinjin and Xue, Tianfan and Dong, Chao},
booktitle={IEEE Conference on Computer Vision and Pattern Recognition},
year={2025},
}
模型信息
屬性 |
詳情 |
基礎模型 |
MAGAer13/mplug-owl2-llama2-7b |
語言 |
en |
許可證 |
mit |
任務類型 |
圖像到文本 |
庫名稱 |
transformers |
本項目是 DepictQA 項目 的一部分,更多信息請訪問 項目頁面、代碼倉庫 或 論文。