C

Colsmol 256M

Developed by vidore
SmolVLM-Instruct-250MをベースにColBERT戦略を採用した視覚検索器で、視覚特徴から効率的にドキュメントをインデックス化可能
Downloads 42.84k
Release Time : 1/22/2025

Model Overview

ColSmolVLMは新しいモデルアーキテクチャとトレーニング戦略に基づく視覚言語モデル(VLM)で、効率的なドキュメント検索のためのテキストと画像のColBERTスタイルのマルチベクトル表現を生成可能

Model Features

ColBERTスタイルマルチベクトル表現
テキストと画像のマルチベクトル表現を生成可能で、検索効率を向上
効率的な視覚ドキュメント検索
視覚特徴からドキュメントをインデックス化するタスクに特化して最適化
LoRAアダプタートレーニング
低ランクアダプター(LoRA)を使用したトレーニングで、パラメータ効率が高い

Model Capabilities

視覚ドキュメント検索
マルチモーダル表現学習
クロスモーダルマッチング

Use Cases

ドキュメント検索
学術文献検索
大量のPDFドキュメントから関連する学術文献を検索
企業ドキュメント管理
企業の内部ドキュメントライブラリを管理し、必要な情報を迅速に検索
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase