S

Smolvlm2 2.2B Instruct I1 GGUF

由mradermacher開發
SmolVLM2-2.2B-Instruct 是一個2.2B參數規模的視覺語言模型,專注於視頻文本到文本任務,支持英語。
下載量 285
發布時間 : 4/25/2025

模型概述

該模型是一個量化版本的視覺語言模型,基於多個視頻和文本數據集訓練,適用於視頻內容理解和生成任務。

模型特點

多數據集訓練
模型基於多個高質量視頻和文本數據集訓練,包括the_cauldron、Docmatix、LLaVA-OneVision-Data等。
量化版本多樣
提供多種量化版本,從極低質量的IQ1_S到高質量的Q6_K,滿足不同硬件和性能需求。
視頻理解能力
專注於視頻內容的理解和文本生成,適用於視頻字幕生成、視頻內容分析等任務。

模型能力

視頻內容理解
文本生成
視頻字幕生成
多模態推理

使用案例

視頻內容分析
視頻字幕生成
為視頻內容生成描述性字幕
視頻內容摘要
從視頻中提取關鍵信息並生成摘要
教育
教育視頻講解
為教育視頻生成講解文本
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase