C

Colqwen2.5 3b Multilingual

Metric-AIによって開発
Qwen2.5-VL-3B-Instructを基にした多言語視覚検索モデルで、ColBERT戦略を採用し、Vidoreベンチマークで優れた性能を発揮
ダウンロード数 1,957
リリース時間 : 2/1/2025

モデル概要

ColQwenは視覚言語モデル(VLM)に基づく新しいアーキテクチャとトレーニング戦略のモデルで、視覚特徴から効率的に文書をインデックス化できます。多言語およびマルチモーダル埋め込みをサポートし、テキストから視覚文書検索タスクに適しています。

モデル特徴

多言語サポート
英語、フランス語、スペイン語、イタリア語、ドイツ語など複数言語の視覚文書検索をサポート
動的入力解像度
元のアスペクト比を変更せずに動的入力画像解像度をサポートし、最大解像度は768画像ブロックまで生成可能
効率的な検索
ColBERT戦略を採用し、マルチベクトルテキストおよび画像表現を生成することで検索効率を向上
高性能
Vidoreベンチマークで、7Bパラメータ以下のモデルで1位、全体で3位の性能を達成

モデル能力

マルチモーダル埋め込み
多言語埋め込み
テキストから視覚文書検索
効率的な文書インデックス化

使用事例

文書検索
多言語文書検索
多言語文書から関連コンテンツを検索
多言語文書を効率的かつ正確に検索
視覚文書検索
視覚文書から関連コンテンツを検索
動的入力解像度をサポートし、検索効率を向上
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase