space-voice-label-detect-beta开源模型 - 快速精准实现语音标签检测，推理快2倍

首页

Space Voice Label Detect Beta

由 devJy 开发

基于Qwen2.5-VL-3B模型的微调版本，使用Unsloth和Huggingface TRL库进行训练，推理速度提升2倍

文本生成图像

Transformers

英语开源协议:Apache-2.0 #高效微调 #4bit量化 #指令优化

下载量 38

发布时间 : 4/5/2025

模型简介

这是一个经过优化的视觉语言模型，支持文本生成和视觉理解任务，特别针对指令跟随场景进行了微调

模型特点

高效训练

使用Unsloth框架训练，速度提升2倍

4-bit量化

采用4-bit量化技术，减少内存占用

多模态能力

同时支持文本和视觉输入的理解与生成

指令优化

针对指令跟随场景特别优化

模型能力

文本生成

视觉问答

多模态理解

指令跟随

使用案例

智能助手

多模态对话

基于文本和图像的交互式对话

能够理解并回答关于图像内容的复杂问题

内容生成

图像描述生成

根据输入图像生成详细描述

生成准确且富有表现力的图像描述

属性	详情
基础模型	unsloth/qwen2.5-vl-3b-instruct-unsloth-bnb-4bit
标签	text-generation-inference、transformers、unsloth、qwen2_5_vl
许可证	apache-2.0
语言	en

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

智启未来，您的人工智能解决方案智库

Space Voice Label Detect Beta

模型简介

模型特点

模型能力

使用案例

🚀 上传的微调模型

🚀 快速开始

模型信息

模型开发信息

训练加速说明

相关图片

📄 许可证