C

Colsmol 500M

vidoreによって開発
SmolVLM-Instruct-500MとColBERT戦略に基づく視覚検索モデルで、視覚的特徴を通じて文書を効率的にインデックス化可能
ダウンロード数 1,807
リリース時間 : 1/22/2025

モデル概要

ColSmolVLMは視覚言語モデル(VLMs)に基づく新しいアーキテクチャとトレーニング戦略で、テキストと画像のColBERT式マルチベクトル表現を生成し、効率的な文書検索に利用

モデル特徴

ColBERT式マルチベクトル表現
テキストと画像のマルチベクトル表現を生成し、検索効率を向上
効率的な視覚的特徴インデックス化
視覚的特徴を通じて文書内容を効率的にインデックス化
LoRAアダプタートレーニング
言語モデルのTransformer層と投影層にLoRAアダプターを適用してトレーニング

モデル能力

視覚文書検索
マルチベクトル表現生成
画像-テキストマッチング

使用事例

文書検索
学術文献検索
視覚的特徴を用いてPDF文書内の関連内容を検索
企業文書管理
社内文書内の関連情報を迅速に特定
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase