C

Colsmol 256M

vidoreによって開発
SmolVLM-Instruct-250MをベースにColBERT戦略を採用した視覚検索器で、視覚特徴から効率的にドキュメントをインデックス化可能
ダウンロード数 42.84k
リリース時間 : 1/22/2025

モデル概要

ColSmolVLMは新しいモデルアーキテクチャとトレーニング戦略に基づく視覚言語モデル(VLM)で、効率的なドキュメント検索のためのテキストと画像のColBERTスタイルのマルチベクトル表現を生成可能

モデル特徴

ColBERTスタイルマルチベクトル表現
テキストと画像のマルチベクトル表現を生成可能で、検索効率を向上
効率的な視覚ドキュメント検索
視覚特徴からドキュメントをインデックス化するタスクに特化して最適化
LoRAアダプタートレーニング
低ランクアダプター(LoRA)を使用したトレーニングで、パラメータ効率が高い

モデル能力

視覚ドキュメント検索
マルチモーダル表現学習
クロスモーダルマッチング

使用事例

ドキュメント検索
学術文献検索
大量のPDFドキュメントから関連する学術文献を検索
企業ドキュメント管理
企業の内部ドキュメントライブラリを管理し、必要な情報を迅速に検索
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase