C

Colqwen2 V1.0

vidoreによって開発
ColQwen2はQwen2-VL-2B-InstructとColBERT戦略に基づく視覚検索モデルで、文書の視覚的特徴を効率的にインデックス化します。
ダウンロード数 106.85k
リリース時間 : 11/3/2024

モデル概要

ColQwen2は視覚言語モデル(VLM)で、テキストと画像のColBERTスタイルのマルチベクトル表現を生成し、主に文書検索タスクに使用されます。

モデル特徴

動的入力画像解像度
サイズ調整なしの元のアスペクト比入力をサポート、最大解像度は最大768画像ブロック生成に設定
マルチベクトル表現
ColBERTスタイルのマルチベクトル表現方法を採用し、検索効率を向上
LoRAアダプター
言語モデルのTransformer層と投影層に低ランクアダプター(LoRA)を適用、パラメータはalpha=32とr=32

モデル能力

視覚文書検索
マルチモーダル表現学習
クロスモーダル検索

使用事例

文書検索
学術文献検索
大量のPDF文書から関連する学術文献を検索
検索効率が大幅に向上
企業文書管理
企業内部文書の効率的なインデックス化と検索
文書検索効率が向上
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase