M

Minicpm Embedding

openbmbによって開発
MiniCPM-Embedding は MiniCPM-2B-sft-bf16 ベースモデルを基に開発された埋め込みモデルで、検索タスクに特化し、中国語と英語の二言語をサポートします。
ダウンロード数 315
リリース時間 : 9/4/2024

モデル概要

このモデルは主にテキスト検索タスクに使用され、高品質なテキスト埋め込みを生成でき、様々な情報検索シナリオに適用可能です。

モデル特徴

二言語サポート
中国語と英語のテキスト検索タスクをサポートします。
効率的な検索
複数の検索タスクで優れた性能を発揮し、特に中国語検索タスクで顕著な成果を示します。
軽量
MiniCPM-2B-sft-bf16 を基にしており、パラメータ規模が比較的小さく、リソースが限られた環境に適しています。

モデル能力

テキスト埋め込み生成
情報検索
二言語検索

使用事例

情報検索
学術文献検索
SCIDOCS データセット内の科学文書など、学術文献の検索に使用されます。
NDCG@10 は 22.38
医療QA検索
CmedqaRetrieval データセットなど、医療関連のQAデータ検索に使用されます。
NDCG@10 は 46.05
EC製品検索
EcomRetrieval データセットなど、ECプラットフォーム上の製品情報検索に使用されます。
NDCG@10 は 70.21
質問応答システム
事実質問
FEVER データセット内のタスクなど、事実に基づく質問に回答するために使用されます。
NDCG@10 は 90.76
オープンドメインQA
NQ データセットなど、オープンドメイン質問応答タスクに使用されます。
NDCG@10 は 69.29
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase