Qwen2.5-vl-vqa-vibook开源视觉问答模型 - 免费部署支持越南语图像问答

首页

Qwen2.5 Vl Vqa Vibook

由 sunbv56 开发

基于Qwen2.5架构的视觉问答模型，专注于越南语场景，支持对图像相关问题进行解答。

文本生成图像其他开源协议:Apache-2.0 #越南语视觉问答 #多模态指令微调 #OCR增强理解

下载量 148

发布时间 : 6/18/2025

模型简介

该模型是一个视觉问答模型，结合了视觉和语言处理能力，能够理解图像内容并回答相关问题，特别针对越南语场景优化。

模型特点

越南语支持

专门针对越南语场景优化，能够处理越南语的视觉问答任务。

多模态能力

结合视觉和语言处理能力，能够理解图像内容并生成相关回答。

轻量级模型

3B参数的规模，适合在资源有限的环境中部署。

模型能力

图像理解

越南语问答

多模态推理

使用案例

教育

越南语学习辅助

帮助学生通过图像理解越南语词汇和场景。

客户服务

自动化客服

通过图像回答客户关于产品的问题。

🚀 视觉问答模型卡片

本模型主要用于视觉问答任务，借助相关技术，能对图像相关问题进行解答，适用于越南语场景。

📚 详细文档

模型详情

属性	详情
基础模型	Qwen/Qwen2.5-VL-3B-Instruct
库名称	peft
许可证	apache - 2.0
数据集	LR - AI - Labs/vi - OCR_VQA
语言	越南语（vi）
任务类型	视觉问答

模型描述

开发者：待补充更多信息
资助方（可选）：待补充更多信息
共享方（可选）：待补充更多信息
模型类型：待补充更多信息
语言（NLP）：待补充更多信息
许可证：待补充更多信息
微调基础模型（可选）：待补充更多信息

模型来源（可选）

仓库：待补充更多信息
论文（可选）：待补充更多信息
演示（可选）：待补充更多信息

使用方式

直接使用

待补充更多信息

下游使用（可选）

待补充更多信息

超出适用范围的使用

待补充更多信息

偏差、风险和局限性

待补充更多信息

建议

用户（直接用户和下游用户）应了解该模型的风险、偏差和局限性。如需进一步建议，还需更多信息。

如何开始使用模型

使用以下代码开始使用该模型。待补充更多信息

训练详情

训练数据

待补充更多信息

训练过程

预处理（可选）

待补充更多信息

训练超参数

训练机制：待补充更多信息（如fp32、fp16混合精度、bf16混合精度、bf16非混合精度、fp16非混合精度、fp8混合精度）

速度、大小、时间（可选）

待补充更多信息

评估

测试数据、因素和指标

测试数据

待补充更多信息

因素

待补充更多信息

指标

待补充更多信息

结果

待补充更多信息

总结

模型检查（可选）

待补充更多信息

环境影响

可使用Lacoste等人（2019）中提出的机器学习影响计算器来估算碳排放。

硬件类型：待补充更多信息
使用时长：待补充更多信息
云服务提供商：待补充更多信息
计算区域：待补充更多信息
碳排放：待补充更多信息

技术规格（可选）

模型架构和目标

待补充更多信息

计算基础设施

硬件

待补充更多信息

软件

待补充更多信息

引用（可选）

BibTeX：待补充更多信息

APA：待补充更多信息

术语表（可选）

待补充更多信息

模型卡片作者（可选）

待补充更多信息

模型卡片联系方式

待补充更多信息

框架版本

PEFT 0.14.0

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

智启未来，您的人工智能解决方案智库

Qwen2.5 Vl Vqa Vibook

模型简介

模型特点

模型能力

使用案例

🚀 视觉问答模型卡片

📚 详细文档

模型详情

模型描述

模型来源（可选）

使用方式

直接使用

下游使用（可选）

超出适用范围的使用

偏差、风险和局限性

建议

如何开始使用模型

训练详情

训练数据

训练过程

预处理（可选）

训练超参数

速度、大小、时间（可选）

评估

测试数据、因素和指标

测试数据

因素

指标

结果

总结

模型检查（可选）

环境影响

技术规格（可选）

模型架构和目标

计算基础设施

硬件

软件

引用（可选）

术语表（可选）

更多信息（可选）

模型卡片作者（可选）

模型卡片联系方式

框架版本