C

Colqwen2.5 3b Multilingual V1.0

Metric-AIによって開発
Qwen2.5-VL-3B-InstructをベースにColBERT戦略を採用した多言語視覚検索モデルで、Vidoreベンチマークテストで優れた性能を発揮
ダウンロード数 2,475
リリース時間 : 2/11/2025

モデル概要

このモデルはQwen2.5-VL-3Bの拡張版で、ColBERTスタイルのマルチベクトルテキストおよび画像表現を生成し、効率的な視覚文書検索に使用可能

モデル特徴

多言語サポート
英語、フランス語、スペイン語、イタリア語、ドイツ語など多言語の視覚文書検索をサポート
動的解像度処理
元のアスペクト比を変更せずに動的入力画像解像度をサポート、最大解像度は最大768画像ブロック生成に設定
効率的検索アーキテクチャ
ColBERTスタイルのマルチベクトル表現を採用し、効率的な視覚文書検索を実現
高性能
Vidoreベンチマークテストで7Bパラメータ以下のモデルで首位、総合ランキング2位を獲得

モデル能力

多言語視覚文書検索
テキストから画像検索
マルチモーダル埋め込み
クロスランゲージ検索

使用事例

文書検索
多言語PDF文書検索
多言語PDF文書ライブラリから関連文書を検索
Vidoreベンチマークテストで優れた性能
クロスランゲージ視覚コンテンツ検索
1つの言語クエリで他の言語の視覚コンテンツを検索
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase