NV Embed V2_分類| AIbase模型庫

首頁

NV Embed V2

由nvidia開發

NV-Embed-v2 是一個基於 sentence-transformers 的嵌入模型，在多個 MTEB 基準測試中表現出色，適用於多種自然語言處理任務。

文本嵌入

Transformers

英語#高精度文本分類 #多任務嵌入 #語義檢索優化

下載量 35.55k

發布時間 : 8/29/2024

模型概述

該模型主要用於文本嵌入和相似度計算，支持分類、聚類、檢索和重排序等多種任務。

模型特點

高性能文本嵌入

在多個 MTEB 基準測試中表現出色，特別是在分類和檢索任務中。

多任務支持

支持多種自然語言處理任務，包括分類、聚類、檢索和重排序。

高準確率

在 AmazonCounterfactualClassification 和 AmazonPolarityClassification 任務中分別達到 94.28% 和 97.74% 的準確率。

模型能力

文本分類

文本聚類

信息檢索

重排序

文本相似度計算

使用案例

電子商務

產品評論分類

用於對亞馬遜產品評論進行分類，識別正面和負面評價。

在 AmazonPolarityClassification 任務中達到 97.74% 的準確率。

反事實評論檢測

檢測亞馬遜上的反事實評論，幫助識別虛假或誤導性內容。

在 AmazonCounterfactualClassification 任務中達到 94.28% 的準確率。

學術研究

論文聚類

對 arXiv 和 bioRxiv 上的學術論文進行聚類，幫助研究人員發現相關研究。

在 ArxivClusteringP2P 和 BiorxivClusteringP2P 任務中分別達到 55.80% 和 54.09% 的 v_measure 分數。

技術支持

重複問題檢測

在 AskUbuntu 社區中檢測重複的技術問題，提高支持效率。

在 AskUbuntuDupQuestions 任務中達到 67.46% 的 map 分數。

🚀 NV-Embed-v2

NV-Embed-v2 是一個在自然語言處理領域表現出色的模型，它在多個 MTEB 數據集上進行了測試，涵蓋分類、檢索、聚類、重排序和語義文本相似度等多種任務，展現出了優秀的性能。

📚 詳細文檔

模型評估結果

數據集名稱	任務類型	主要得分
MTEB AmazonCounterfactualClassification (en)	Classification	94.28358208955224
MTEB AmazonPolarityClassification	Classification	97.74185000000001
MTEB AmazonReviewsClassification (en)	Classification	63.96000000000001
MTEB ArguAna	Retrieval	70.074
MTEB ArxivClusteringP2P	Clustering	55.79933795955242
MTEB ArxivClusteringS2S	Clustering	51.262845995850334
MTEB AskUbuntuDupQuestions	Reranking	67.46477327480808
MTEB BIOSSES	STS	87.41644967443246
MTEB Banking77Classification	Classification	92.41558441558443
MTEB BiorxivClusteringP2P	Clustering	54.08649516394218
MTEB BiorxivClusteringS2S	Clustering	49.60352214167779
MTEB CQADupstackRetrieval	Retrieval	50.24175000000001
MTEB ClimateFEVER	Retrieval	45.388
MTEB DBPedia	Retrieval	53.496
MTEB EmotionClassification	Classification	93.38499999999999
MTEB FEVER	Retrieval	93.74900000000001
MTEB FiQA2018	Retrieval	65.729
MTEB HotpotQA	Retrieval	85.479
MTEB ImdbClassification	Classification	97.1376
MTEB MSMARCO	Retrieval	45.629999999999995
MTEB MTOPDomainClassification (en)	Classification	99.24988600091199
MTEB MTOPIntentClassification (en)	Classification	94.3684450524396
MTEB MassiveIntentClassification (en)	Classification	86.09616677874916
MTEB MassiveScenarioClassification (en)	Classification	92.17215870880968
MTEB MedrxivClusteringP2P	Clustering	46.09497344077905
MTEB MedrxivClusteringS2S	Clustering	44.861049989560684
MTEB MindSmallReranking	Reranking	31.75936162919999
MTEB NFCorpus	Retrieval	45.174
MTEB NQ	Retrieval	73.568
MTEB QuoraRetrieval	Retrieval	89.035
MTEB RedditClustering	Clustering	71.0984522742521
MTEB RedditClusteringP2P	Clustering	74.94499641904133
MTEB SCIDOCS	Retrieval	21.901
MTEB SICK-R	STS	82.14763206055602
MTEB STS12	STS	77.89286260403269
MTEB STS13	STS	88.30238972017452
MTEB STS14	STS	84.29920990970672
MTEB STS15	STS	89.03555007807218
MTEB STS16	STS	86.77353371581373
MTEB STS17 (en-en)	STS	90.66976712249057
MTEB STS22 (en)	STS	68.11632448161046
MTEB STSBenchmark	STS	88.40520383147418
MTEB SciDocsRR	Reranking	87.58627126942797
MTEB SciFact	Retrieval	80.12700000000001
MTEB SprintDuplicateQuestions	PairClassification	99.87623762376238
MTEB StackExchangeClustering	Clustering	82.10134099988541
MTEB StackExchangeClusteringP2P	Clustering	48.357450742397404
MTEB StackOverflowDupQuestions

部分數據集詳細指標

MTEB AmazonCounterfactualClassification (en)

指標類型	值
accuracy	94.28358208955224
accuracy_stderr	0.40076780842082305
ap	76.49097318319616
ap_stderr	1.2418692675183929
f1	91.41982003001168
f1_stderr	0.5043921413093579
main_score	94.28358208955224

MTEB ArguAna

指標類型	值
map_at_1	46.515
map_at_10	62.392
map_at_100	62.732
map_at_1000	62.733000000000004
map_at_3	58.701
map_at_5	61.027
mrr_at_1	0.0
mrr_at_10	0.0
mrr_at_100	0.0
mrr_at_1000	0.0
mrr_at_3	0.0
mrr_at_5	0.0
ndcg_at_1	46.515
ndcg_at_10	70.074
ndcg_at_100	71.395
ndcg_at_1000	71.405
ndcg_at_3	62.643
ndcg_at_5	66.803
precision_at_1	46.515
precision_at_10	9.41
precision_at_100	0.996
precision_at_1000	0.1
precision_at_3	24.68
precision_at_5	16.814
recall_at_1	46.515
recall_at_10	94.097
recall_at_100	99.57300000000001
recall_at_1000	99.644
recall_at_3	74.03999999999999
recall_at_5	84.068
main_score	70.074