🚀 DeQA-Score-Mix3
DeQA-Score 是一个图像质量评估模型,其权重在 KonIQ、SPAQ 和 KADID 数据集上进行了全量微调。本项目提供了该模型的相关代码、论文以及项目页面链接,方便研究人员和开发者使用。
🚀 快速开始
使用 AutoModel 快速启动
对于这张图片:
,使用 transformers==4.36.1
启动一个 AutoModel 评分器:
import requests
import torch
from transformers import AutoModelForCausalLM
model = AutoModelForCausalLM.from_pretrained(
"zhiyuanyou/DeQA-Score-Mix3",
trust_remote_code=True,
attn_implementation="eager",
torch_dtype=torch.float16,
device_map="auto",
)
from PIL import Image
score = model.score(
[Image.open(requests.get(
"https://raw.githubusercontent.com/zhiyuanyou/DeQA-Score/main/fig/singapore_flyer.jpg", stream=True
).raw)]
)
“score” 的结果应该是 1.9404(范围在 [1,5] 内,值越高越好)。
💻 使用示例
基础用法
上述快速开始部分的代码即为基础用法示例,展示了如何使用 transformers
库加载预训练模型并对单张图像进行质量评分。
📚 详细文档
无参考图像质量评估结果(PLCC / SRCC)
数据集 |
KonIQ |
SPAQ |
KADID |
PIPAL |
LIVE-Wild |
AGIQA |
TID2013 |
CSIQ |
Q-Align (基线) |
0.945 / 0.938 |
0.933 / 0.931 |
0.935 / 0.934 |
0.409 / 0.420 |
0.887 / 0.883 |
0.788 / 0.733 |
0.829 / 0.808 |
0.876 / 0.845 |
DeQA-Score (我们的方法) |
0.956 / 0.943 |
0.938 / 0.934 |
0.955 / 0.953 |
0.495 / 0.496 |
0.900 / 0.887 |
0.808 / 0.745 |
0.852 / 0.820 |
0.900 / 0.857 |
引用信息
如果您发现我们的工作对您的研究和应用有帮助,请使用以下 BibTeX 进行引用:
@inproceedings{deqa_score,
title={Teaching Large Language Models to Regress Accurate Image Quality Scores using Score Distribution},
author={You, Zhiyuan and Cai, Xin and Gu, Jinjin and Xue, Tianfan and Dong, Chao},
booktitle={IEEE Conference on Computer Vision and Pattern Recognition},
year={2025},
}
模型信息
属性 |
详情 |
基础模型 |
MAGAer13/mplug-owl2-llama2-7b |
语言 |
en |
许可证 |
mit |
任务类型 |
图像到文本 |
库名称 |
transformers |
本项目是 DepictQA 项目 的一部分,更多信息请访问 项目页面、代码仓库 或 论文。