C

Colqwen2.5 3b Multilingual V1.0 Merged

tsystemsによって開発
Qwen2.5-VL-3B-InstructとColBERT戦略に基づく多言語視覚検索モデルで、動的入力画像解像度をサポートし、ColBERTスタイルのマルチベクトルテキストと画像表現を生成します。
ダウンロード数 70
リリース時間 : 3/9/2025

モデル概要

このモデルは、視覚言語モデル(VLMs)に基づく新しいアーキテクチャとトレーニング戦略のモデルで、視覚特徴を通じて文書を効率的にインデックス化し、多言語およびマルチモーダル埋め込みをサポートします。

モデル特徴

多言語サポート
英語、フランス語、スペイン語、イタリア語、ドイツ語など、複数言語の視覚文書検索をサポート
動的画像解像度
動的入力画像解像度をサポートし、アスペクト比を変更せず、最大解像度は最大768画像ブロック生成に設定
効率的な検索
ColBERTスタイルのマルチベクトル表現を採用し、効率的な文書検索を実現
マルチモーダル埋め込み
テキストと画像の共同埋め込みをサポートし、クロスモーダル検索を実現

モデル能力

多言語視覚文書検索
テキストから画像検索
マルチモーダル埋め込み
動的画像処理

使用事例

文書検索
多言語PDF文書検索
多言語PDF文書内でテキストクエリに基づき関連画像や文書フラグメントを検索
関連文書内容を効率的に検索し、複数言語をサポート
視覚質問応答システム
視覚質問応答システムで質問に基づき関連画像や文書内容を検索
質問応答システムの精度と効率を向上
クロスモーダル検索
テキストから画像検索
テキスト記述に基づき関連画像を検索
効率的なクロスモーダル検索を実現
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase