S

Smolvlm2 2.2B Instruct I1 GGUF

由 mradermacher 开发
SmolVLM2-2.2B-Instruct 是一个2.2B参数规模的视觉语言模型,专注于视频文本到文本任务,支持英语。
下载量 285
发布时间 : 4/25/2025

模型简介

该模型是一个量化版本的视觉语言模型,基于多个视频和文本数据集训练,适用于视频内容理解和生成任务。

模型特点

多数据集训练
模型基于多个高质量视频和文本数据集训练,包括the_cauldron、Docmatix、LLaVA-OneVision-Data等。
量化版本多样
提供多种量化版本,从极低质量的IQ1_S到高质量的Q6_K,满足不同硬件和性能需求。
视频理解能力
专注于视频内容的理解和文本生成,适用于视频字幕生成、视频内容分析等任务。

模型能力

视频内容理解
文本生成
视频字幕生成
多模态推理

使用案例

视频内容分析
视频字幕生成
为视频内容生成描述性字幕
视频内容摘要
从视频中提取关键信息并生成摘要
教育
教育视频讲解
为教育视频生成讲解文本
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase