SmolVLM2-2.2B-Instructオープンソースビジュアル言語モデル - 無料でデプロイし、英語のビデオテキストをテキスト化を支援

ホーム

Smolvlm2 2.2B Instruct GGUF

mradermacherによって開発

SmolVLM2-2.2B-Instructは2.2Bパラメータの視覚言語モデルで、動画テキストからテキストへのタスクに特化し、英語をサポートしています。

英語オープンソースライセンス:Apache-2.0 #動画指示理解 #マルチモーダル量子化 #軽量視覚言語

ダウンロード数 235

リリース時間 : 4/25/2025

モデル概要

このモデルはHuggingFaceTB/SmolVLM2-2.2B-Instructに基づく量子化版の視覚言語モデルで、動画関連のテキスト生成タスクの処理に特化しています。

モデル特徴

複数データセットでの学習

モデルはDocmatix、LLaVA-OneVision-Dataなどの高品質な複数データセットで学習されており、汎化能力が強化されています。

多様な量子化バージョン

Q2_K、Q3_K_Sなど複数の量子化バージョンを提供しており、ユーザーは速度と品質のバランスを考慮して適切なバージョンを選択できます。

効率的な推論

量子化バージョンによりモデルサイズが大幅に縮小され、推論速度が向上し、リソースが限られた環境に適しています。

モデル能力

動画テキスト生成

マルチモーダル理解

指示追従

使用事例

動画コンテンツ分析

動画字幕生成

動画の内容に基づいて記述的な字幕を生成します。

動画質問応答

動画の内容に関する特定の質問に答えます。

教育

教育動画の要約

教育動画の簡潔な要約を生成し、学生が内容を迅速に理解できるようにします。

🚀 SmolVLM2-2.2B-Instruct

SmolVLM2-2.2B-Instructは、ビデオとテキストを扱うモデルで、特定のデータセットを用いて学習されています。このモデルの静的量子化バージョンが提供されています。

🚀 クイックスタート

このモデルに関する基本的な情報や使用方法を説明します。

モデル情報

属性	详情
ベースモデル	HuggingFaceTB/SmolVLM2-2.2B-Instruct
学習データセット	- HuggingFaceM4/the_cauldron - HuggingFaceM4/Docmatix - lmms-lab/LLaVA-OneVision-Data - lmms-lab/M4-Instruct-Data - HuggingFaceFV/finevideo - MAmmoTH-VL/MAmmoTH-VL-Instruct-12M - lmms-lab/LLaVA-Video-178K - orrzohar/Video-STaR - Mutonix/Vript - TIGER-Lab/VISTA-400K - Enxin/MovieChat-1K_train - ShareGPT4Video/ShareGPT4Video
言語	en
ライブラリ名	transformers
ライセンス	apache - 2.0
量子化担当者	mradermacher
タグ	video - text - to - text

概要

https://huggingface.co/HuggingFaceTB/SmolVLM2-2.2B-Instruct の静的量子化バージョンです。重み付き/imatrixの量子化データは、https://huggingface.co/mradermacher/SmolVLM2-2.2B-Instruct-i1-GGUF で入手できます。

💻 使用例

基本的な使用法

GGUFファイルの使い方がわからない場合は、TheBlokeのREADME を参照してください。ここには、マルチパートファイルの結合方法などの詳細が記載されています。

📚 ドキュメント

提供される量子化バージョン

（サイズ順に並んでいますが、必ずしも品質順ではありません。IQ量子化は、同じサイズの非IQ量子化よりも優れていることが多いです。）

リンク	タイプ	サイズ(GB)	備考
GGUF	Q2_K	0.8
GGUF	Q3_K_S	0.9
GGUF	Q3_K_M	1.0	品質が低い
GGUF	Q3_K_L	1.1
GGUF	IQ4_XS	1.1
GGUF	Q4_K_S	1.2	高速、推奨
GGUF	Q4_K_M	1.2	高速、推奨
GGUF	Q5_K_S	1.4
GGUF	Q5_K_M	1.4
GGUF	Q6_K	1.6	非常に良い品質
GGUF	Q8_0	2.0	高速、最高品質
GGUF	f16	3.7	16 bpw, 過剰