C

Colqwen2.5 V0.2

vidoreによって開発
ColQwen2.5はQwen2.5-VL-3B-InstructとColBERT戦略に基づく視覚検索モデルで、視覚的特徴による効率的な文書インデックス化に特化しています。
ダウンロード数 22.31k
リリース時間 : 1/31/2025

モデル概要

ColQwen2.5は視覚言語モデル(VLM)で、テキストと画像のColBERTスタイルのマルチベクトル表現を生成し、効率的な文書検索に使用されます。

モデル特徴

動的入力画像解像度
動的入力画像解像度をサポートし、サイズ調整を行わずに同じアスペクト比で処理します。
マルチベクトル表現
テキストと画像のColBERTスタイルのマルチベクトル表現を生成し、検索効率を向上させます。
高解像度処理
最大解像度は最大768個の画像ブロックを生成するように設定され、画像ブロック数を増やすことで効果が大幅に向上します。

モデル能力

視覚文書検索
マルチベクトル表現生成
動的画像処理

使用事例

文書検索
学術文書検索
学術論文内の関連コンテンツを検索するために使用されます。
PDF文書検索
PDF文書内の視覚およびテキスト情報を検索するために使用されます。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase