M

Minicpm Embedding

由openbmb開發
MiniCPM-Embedding 是基於 MiniCPM-2B-sft-bf16 基礎模型開發的嵌入模型,專注於檢索任務,支持中英文雙語。
下載量 315
發布時間 : 9/4/2024

模型概述

該模型主要用於文本檢索任務,能夠生成高質量的文本嵌入,適用於多種信息檢索場景。

模型特點

雙語支持
支持中文和英文的文本檢索任務。
高效檢索
在多個檢索任務中表現出色,尤其是在中文檢索任務中表現優異。
輕量級
基於 MiniCPM-2B-sft-bf16,參數規模相對較小,適合資源有限的環境。

模型能力

文本嵌入生成
信息檢索
雙語檢索

使用案例

信息檢索
學術文獻檢索
用於檢索學術文獻,如 SCIDOCS 數據集中的科學文檔。
NDCG@10 為 22.38
醫療問答檢索
用於檢索醫療相關的問答數據,如 CmedqaRetrieval 數據集。
NDCG@10 為 46.05
電商產品檢索
用於檢索電商平臺上的產品信息,如 EcomRetrieval 數據集。
NDCG@10 為 70.21
問答系統
事實問答
用於回答事實性問題,如 FEVER 數據集中的任務。
NDCG@10 為 90.76
開放域問答
用於開放域問答任務,如 NQ 數據集。
NDCG@10 為 69.29
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase