C

Colnomic Embed Multimodal 3b

由nomic-ai開發
ColNomic Embed多模態3B是一款30億參數的多模態嵌入模型,專為視覺文檔檢索任務設計,支持多語言文本和圖像的統一編碼。
下載量 4,636
發布時間 : 3/27/2025

模型概述

該模型在視覺文檔檢索任務中表現卓越,能夠直接編碼交錯排列的文本和圖像,無需複雜預處理,適用於多種文檔檢索場景。

模型特點

高性能視覺文檔檢索
在Vidore-v2上達到61.2 NDCG@5,僅次於ColNomic Embed多模態7B。
統一文本-圖像編碼
直接編碼交錯排列的文本和圖像,無需複雜預處理。
多語言支持
支持英語、意大利語、法語、德語和西班牙語等多種語言。
多向量輸出
提供多向量輸出選項,提升性能表現。

模型能力

文本編碼
圖像編碼
多模態檢索
多語言處理

使用案例

研究論文檢索
捕獲公式和圖表
檢索包含特定公式或圖表的研究論文。
能夠準確識別和檢索包含複雜科學內容的文檔。
技術文檔管理
代碼塊和流程圖檢索
在技術文檔中查找特定代碼塊或流程圖。
有效識別技術文檔中的代碼和視覺元素。
財務報告分析
圖表和數據檢索
能夠準確識別財務報告中的關鍵數據可視化內容。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase