C

Colnomic Embed Multimodal 7b

由nomic-ai開發
ColNomic Embed Multimodal 7B是一款多向量最先進的多模態嵌入模型,擅長視覺文檔檢索任務,支持多語言和統一文本圖像編碼。
下載量 7,909
發布時間 : 3/31/2025

模型概述

該模型是一款70億參數的多模態嵌入模型,專為視覺文檔檢索任務設計,能夠直接編碼交錯排列的文本和圖像,無需複雜預處理。

模型特點

高性能
在Vidore-v2上達到62.7 NDCG@5,超越所有其他模型
統一文本圖像編碼
直接編碼交錯排列的文本和圖像,無需複雜預處理
先進架構
70億參數的多模態嵌入模型
完全開源
提供模型權重、訓練數據和代碼
多語言支持
支持英語、意大利語、法語、德語和西班牙語

模型能力

視覺文檔檢索
多模態嵌入
多語言嵌入
文本到視覺文檔檢索

使用案例

研究論文
捕獲公式、圖表和表格
用於檢索包含複雜科學公式和圖表的學術論文
提高檢索準確率
技術文檔
編碼代碼塊、流程圖和截圖
用於檢索技術文檔中的代碼示例和系統架構圖
更精準的技術內容檢索
產品目錄
產品圖像檢索
根據產品描述檢索相關產品圖像
提升電子商務體驗
財務報告
嵌入圖表、圖形和數值數據
用於檢索財務報告中的關鍵數據可視化
快速定位關鍵財務指標
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase