Q

Qwen2.5 VL 7B Instruct Gemlite Ao A8w8

mobiuslabsgmbhによって開発
これはA8W8量子化されたマルチモーダル大規模言語モデルで、Qwen2.5-VL-7B-Instructに基づいており、視覚と言語のタスクをサポートします。
ダウンロード数 161
リリース時間 : 6/4/2025

モデル概要

このモデルはQwen2.5-VL-7B-Instructの量子化バージョンで、TorchAOとGemLiteをバックエンドとして使用し、視覚言語の理解と生成タスクに適しています。

モデル特徴

A8W8量子化
モデルは8ビットの活性化と8ビットの重みで量子化され、メモリ使用量と計算要件を削減します。
マルチモーダルサポート
画像とテキストの入力を同時に処理し、視覚言語の理解を実現します。
高効率推論
TorchAOとGemLiteバックエンドを使用して推論性能を最適化します。

モデル能力

画像記述生成
視覚質問応答
マルチモーダル対話
テキスト生成

使用事例

コンテンツ理解
画像記述
入力画像に基づいて自然言語の記述を生成します。
画像内容を正確に記述するテキストを生成できます。
スマートアシスタント
マルチモーダル対話
画像とテキストを組み合わせて対話を行います。
画像内容を理解し、関連する質問に回答できます。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase