Qwen2.5-VL-72B-Instruct-GGUFオープンソース多モーダル大規模言語モデル - 画像と文章の生成および長文の多言語処理をサポート

ホーム

Qwen2.5 VL 72B Instruct GGUF

lmstudio-communityによって開発

通義千問が提供するマルチモーダル大規模モデルで、画像とテキストの生成、および128kの長コンテキスト処理をサポートし、多言語能力を備えています。

画像生成テキスト英語オープンソースライセンス:その他 #マルチモーダル画像分析 #128k長コンテキスト #ビジュアルエージェント推論

ダウンロード数 668

リリース時間 : 5/8/2025

モデル概要

これはマルチモーダル指令モデルで、画像とテキストの入力を処理し、テキスト出力を生成することができます。長コンテキスト、多言語、構造化出力をサポートし、さまざまなAIタスクに適しています。

モデル特徴

長コンテキストサポート

128kトークンのコンテキスト長をサポートし、長いドキュメントや複雑なタスクの処理に適しています

マルチモーダル認識

画像内の物体、テキスト、グラフ、アイコン、図形、レイアウトを認識することができます

ビジュアルインテリジェントエージェント

ビジュアルエージェントとして推論を行い、ツールを動的に呼び出すことができ、コンピュータや携帯電話の使用能力を備えています

構造化出力

構造化出力と安定したJSON形式を生成することができます

多言語サポート

複数の言語の入力と出力をサポートします

モデル能力

画像理解

テキスト生成

マルチモーダル推論

ツール呼び出し

構造化データ生成

長いドキュメントの処理

使用事例

ビジュアルコンテンツ分析

画像説明生成

入力された画像に対して詳細なテキスト説明を生成します

画像内の物体、シーン、テキスト内容を正確に識別します

グラフ理解

画像内のグラフデータを分析し、情報を抽出します

一般的なグラフタイプを理解し、重要なデータを抽出することができます

インテリジェントエージェント

コンピュータ支援操作

ビジュアル入力に基づいてコンピュータ操作を指示します

画面内容を理解し、操作命令を生成することができます

コンテンツ生成

構造化レポート生成

マルチモーダル入力に基づいて構造化レポートを生成します

安定したJSONまたはその他の構造化データ形式で出力します

🚀 通义千问2.5 VL 72B指令モデル

これは通义千问が提供する画像テキストからテキストを生成するモデルで、マルチモーダルタスクを処理でき、128kのコンテキスト長をサポートし、多言語能力を備えています。

🚀 クイックスタート

このモデルは通义千问によって作成され、元のモデルは通义千问2.5-VL-72B指令モデルです。

GGUF量子化は bartowski によって、llama.cpp のバージョン b5317 をベースに提供されています。

✨ 主な機能

長コンテキストサポート：128kトークンのコンテキスト長をサポートします。
マルチモーダル認識：花や鳥、魚、虫などの一般的な物体を認識でき、画像内のテキスト、グラフ、アイコン、図形、レイアウトを分析することもできます。
ビジュアルインテリジェントエージェント：ビジュアルエージェントとして推論し、ツールを動的に呼び出すことができ、コンピューターや携帯電話の使用能力を備えています。
構造化出力：構造化出力や安定したJSON出力の生成に役立ちます。
多言語サポート：複数の言語をサポートしています。

🔧 技術詳細

このモデルは128kトークンのコンテキスト長をサポートし、花や鳥、魚、虫などの一般的な物体を認識でき、強力な画像分析能力を備えており、画像内のテキスト、グラフ、アイコン、図形、レイアウトを処理することができます。また、ビジュアルエージェントとして推論し、ツールを呼び出すことができ、コンピューターや携帯電話の使用をサポートしています。出力に関しては、構造化された安定したJSON出力を生成することができ、多言語をサポートしています。

📄 ライセンス

このモデルのライセンス情報はこちらをご覧ください。ライセンス名は qwen です。

特別な感謝

このすべてを可能にしてくれた Georgi Gerganov と llama.cpp チームに特別な感謝を表します。

免責事項

LM Studioは、コミュニティモデルプロジェクト内のいかなるモデルの作成者、発起人、所有者でもありません。各コミュニティモデルはサードパーティによって作成および提供されています。LM Studioは、いかなるコミュニティモデルの完全性、信頼性、正確性、または信頼性を承認、支持、代表、または保証しません。あなたは、コミュニティモデルが不快な、有害な、不正確な、またはその他不適切な、欺瞞的な内容を生成する可能性があることを理解すべきです。各コミュニティモデルの唯一の責任は、そのモデルを発起した個人または団体にあります。LM Studioはコミュニティモデルを監視または制御することはなく、また、そのようなモデルに対して責任を負うことはできません。LM Studioは、コミュニティモデルの正確性、信頼性、または有益性に関するすべての保証または保険を負いません。さらに、LM Studioは、コミュニティモデルがあなたの要求を満たすこと、安全であること、中断なく動作すること、またはいつでもどこでも利用可能であること、エラーがないこと、ウイルスがないこと、またはいかなるエラーが修正されることを保証しません。あなたは、コミュニティモデルの使用またはアクセス、コミュニティモデルのダウンロード、またはLM Studioによって提供される、またはLM Studioを通じて提供される他のコミュニティモデルの使用に起因するすべての損害に対して独自に責任を負うことになります。