Qwen2.5 VL 32B Instruct GGUF
Qwen2.5-VL-32B-Instructは、マルチモーダルタスクに適した、強化された数学力と問題解決能力を備えた強力なビジュアル言語モデルです。
ダウンロード数 464
リリース時間 : 5/11/2025
モデル概要
Qwen2.5-VL-32B-Instructは、画像分析、テキスト理解、チャート解析、動画理解に優れた、命令調整済みのビジュアル言語モデルで、様々な形式のビジュアルローカライゼーションと構造化出力をサポートします。
モデル特徴
強化されたビジュアル理解能力
画像内のテキスト、チャート、アイコン、グラフィック、レイアウトを効率的に分析できます。
エージェント能力
ビジュアルエージェントとして機能し、ツールを動的に呼び出し、コンピュータやスマートフォンの使用能力を備えています。
長編動画理解
1時間以上の動画を理解し、関連する動画クリップを正確に特定できます。
ビジュアルローカライゼーション
画像内のオブジェクトを正確に特定するためのバウンディングボックスやポイントの生成をサポートし、座標と属性のJSON形式を安定して出力できます。
構造化出力
インボイススキャン、表などのデータの構造化出力をサポートし、金融、ビジネスなどの分野に適しています。
モデル能力
画像分析
テキスト理解
チャート解析
動画理解
ビジュアルローカライゼーション
構造化出力
ツール呼び出し
使用事例
金融
インボイス処理
インボイス内容を自動解析し、構造化データを生成します。
データ処理の効率と正確性を向上させます。
ビジネス
表解析
スキャンされた表から構造化情報を抽出します。
データ入力プロセスを簡素化します。
教育
チャート理解
教育資料内のチャートやグラフィックを解析します。
学習と教育を支援します。
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98