C

Colnomic Embed Multimodal 7b

nomic-aiによって開発
ColNomic Embed Multimodal 7Bは、マルチベクトルの最先端マルチモーダル埋め込みモデルで、視覚文書検索タスクに優れ、多言語対応と統一テキスト画像エンコーディングをサポートします。
ダウンロード数 7,909
リリース時間 : 3/31/2025

モデル概要

このモデルは70億パラメータのマルチモーダル埋め込みモデルで、視覚文書検索タスク向けに設計されており、複雑な前処理なしでテキストと画像を直接エンコードできます。

モデル特徴

高性能
Vidore-v2で62.7 NDCG@5を達成し、他のすべてのモデルを凌駕
統一テキスト画像エンコーディング
複雑な前処理なしでテキストと画像を直接エンコード
先進アーキテクチャ
70億パラメータのマルチモーダル埋め込みモデル
完全オープンソース
モデル重み、トレーニングデータ、コードを提供
多言語サポート
英語、イタリア語、フランス語、ドイツ語、スペイン語をサポート

モデル能力

視覚文書検索
マルチモーダル埋め込み
多言語埋め込み
テキストから視覚文書検索

使用事例

研究論文
数式、図表、表のキャプチャ
複雑な科学数式や図表を含む学術論文の検索に使用
検索精度向上
技術文書
コードブロック、フローチャート、スクリーンショットのエンコード
技術文書内のコード例やシステムアーキテクチャ図の検索に使用
より正確な技術コンテンツ検索
製品カタログ
製品画像検索
製品説明に基づいて関連製品画像を検索
eコマース体験向上
財務報告書
チャート、グラフ、数値データの埋め込み
財務報告書内の重要なデータ可視化の検索に使用
重要な財務指標の迅速な特定
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase