Q

Qwen2 VL 72B Instruct GGUF

second-stateによって開発
Qwen2-VL-72B-InstructのGGUF量子化バージョンで、マルチモーダルの画像テキストからテキストへの変換をサポートし、LlamaEdgeで実行できます。
ダウンロード数 221
リリース時間 : 12/15/2024

モデル概要

これはマルチモーダルモデルで、画像とテキストの入力を処理し、テキスト結果を出力できます。さまざまな量子化バージョンが提供され、さまざまなシナリオのニーズに対応しています。

モデル特徴

マルチモーダルサポート
画像とテキストの入力を同時に処理し、テキスト結果を出力できます。
複数の量子化オプション
2ビットから16ビットまでの複数の量子化バージョンを提供し、さまざまなシナリオのニーズを満たします。
大規模コンテキストサポート
128000のコンテキストサイズをサポートします。

モデル能力

画像理解
テキスト生成
マルチモーダル推論

使用事例

視覚質問応答
画像説明生成
入力画像に基づいて詳細なテキスト説明を生成します。
視覚推論
画像内容に基づいて論理的な推論と質問に対する解答を行います。
マルチモーダルアプリケーション
画像テキスト対話システム
画像とテキストを同時に理解できる対話システムを構築します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase