C

Colqwen2 7b V1.0

yydxlvによって開発
Qwen2-VL-7B-InstructとColBERT戦略に基づく視覚検索モデルで、マルチベクトルテキストと画像表現をサポート
ダウンロード数 25
リリース時間 : 12/24/2024

モデル概要

ColQwenは新しい視覚言語モデルアーキテクチャで、視覚的特徴による文書の効率的なインデックス化が可能で、特にPDF類の文書検索に適している

モデル特徴

動的画像解像度サポート
アスペクト比を変更せずに動的な入力画像解像度をサポートし、最大768個の画像パッチを生成可能
マルチベクトル表現
ColBERTスタイルのマルチベクトルテキストと画像表現を採用し、検索効率を向上
効率的な学習戦略
LoRAアダプターを使用した学習で、計算リソースの使用を最適化

モデル能力

視覚文書検索
マルチモーダル埋め込み
画像特徴抽出
テキスト特徴抽出

使用事例

文書検索
PDF文書検索
視覚的特徴に基づくPDF文書内容検索
文書検索効率の向上
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase