S

Smolvlm2 2.2B Instruct I1 GGUF

mradermacherによって開発
SmolVLM2-2.2B-Instructは2.2Bパラメータ規模の視覚言語モデルで、ビデオテキストからテキストへのタスクに特化し、英語をサポートしています。
ダウンロード数 285
リリース時間 : 4/25/2025

モデル概要

このモデルは量子化バージョンの視覚言語モデルで、複数のビデオとテキストデータセットに基づいて訓練されており、ビデオコンテンツの理解と生成タスクに適しています。

モデル特徴

複数データセット訓練
モデルはthe_cauldron、Docmatix、LLaVA-OneVision-Dataなどの高品質なビデオとテキストデータセットに基づいて訓練されています。
多様な量子化バージョン
極低品質のIQ1_Sから高品質のQ6_Kまで、さまざまな量子化バージョンを提供し、異なるハードウェアと性能要件に対応します。
ビデオ理解能力
ビデオコンテンツの理解とテキスト生成に特化しており、ビデオ字幕生成、ビデオコンテンツ分析などのタスクに適しています。

モデル能力

ビデオコンテンツ理解
テキスト生成
ビデオ字幕生成
マルチモーダル推論

使用事例

ビデオコンテンツ分析
ビデオ字幕生成
ビデオコンテンツに記述的な字幕を生成する
ビデオコンテンツ要約
ビデオからキー情報を抽出し要約を生成する
教育
教育ビデオ解説
教育ビデオの解説テキストを生成する
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase