Q

Qwen2.5 VL 32B Instruct GGUF

samgreenによって開発
Qwen2.5-VL-32B-Instruct は、画像とテキストの共同理解と生成タスクをサポートするマルチモーダル視覚言語モデルです。
ダウンロード数 25.59k
リリース時間 : 3/25/2025

モデル概要

このモデルは32Bパラメータ規模のマルチモーダルモデルで、画像とテキストの共同タスクを処理でき、画像説明、視覚的質問応答などさまざまな応用シナリオをサポートします。

モデル特徴

マルチモーダル能力
画像とテキストの共同処理をサポートし、画像内容を理解して関連するテキスト説明を生成できます。
大規模モデル
32Bパラメータ規模で、強力な理解と生成能力を備えています。
量子化サポート
GGUF形式の量子化をサポートし、さまざまなハードウェアでの展開が容易です。

モデル能力

画像説明生成
視覚的質問応答
マルチモーダル推論

使用事例

コンテンツ生成
画像説明
入力画像に基づいて詳細なテキスト説明を生成します。
正確かつ詳細な画像説明テキストを生成します。
インテリジェント質問応答
視覚的質問応答
画像内容に関する自然言語の質問に答えます。
正確かつ関連性のある回答を提供します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase