Q

Qwen2 VL 72B Instruct GGUF

gaianetによって開発
Qwen2-VL-72B-Instruct-GGUFは、元のモデルを量子化処理したバージョンで、マルチモーダルタスクをサポートし、GaiaNetを通じて実行できます。
ダウンロード数 1,803
リリース時間 : 12/15/2024

モデル概要

これはマルチモーダルモデルで、画像テキストからテキストへのタスクをサポートし、複雑な視覚言語理解と生成タスクに適しています。

モデル特徴

マルチモーダルサポート
画像とテキストの連合処理をサポートし、複雑な視覚言語タスクに適しています。
高パラメータ数
720億のパラメータを持ち、強力な理解と生成能力を備えています。
量子化バージョン
量子化処理が施されており、リソースが限られたデバイスでの実行が容易です。

モデル能力

画像理解
テキスト生成
マルチモーダル推論

使用事例

視覚質問応答
画像記述生成
入力された画像に基づいて詳細なテキスト記述を生成します。
文書理解
文書内容抽出
画像内の文書から重要な情報を抽出し、構造化されたテキストを生成します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase