C

Colsmolvlm V0.1

vidoreによって開発
SmolVLM-InstructとColBERT戦略に基づく視覚検索モデルで、視覚的特徴を通じて文書を効率的にインデックス化可能
ダウンロード数 1,353
リリース時間 : 11/27/2024

モデル概要

ColSmolVLMは視覚言語モデル(VLM)に基づく新しいアーキテクチャとトレーニング戦略のモデルで、テキストと画像のColBERTスタイルのマルチベクトル表現を生成し、効率的な文書検索に利用可能

モデル特徴

ColBERTスタイルのマルチベクトル表現
テキストと画像のマルチベクトル表現を生成し、検索効率を向上
視覚文書検索
PDF類の文書に特化して最適化された検索能力
LoRAアダプター
低ランクアダプター(LoRA)を使用した効率的なトレーニング

モデル能力

視覚文書検索
マルチモーダル表現学習
クロスモーダルマッチング

使用事例

文書検索
学術文献検索
視覚的特徴を通じて学術PDF文書を検索
企業文書管理
大量のPDF文書を効率的にインデックス化・管理
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase