NV Embed V2
N
NV Embed V2
由nvidia開發
NV-Embed-v2 是一個基於 sentence-transformers 的嵌入模型,在多個 MTEB 基準測試中表現出色,適用於多種自然語言處理任務。
下載量 35.55k
發布時間 : 8/29/2024
模型概述
該模型主要用於文本嵌入和相似度計算,支持分類、聚類、檢索和重排序等多種任務。
模型特點
高性能文本嵌入
在多個 MTEB 基準測試中表現出色,特別是在分類和檢索任務中。
多任務支持
支持多種自然語言處理任務,包括分類、聚類、檢索和重排序。
高準確率
在 AmazonCounterfactualClassification 和 AmazonPolarityClassification 任務中分別達到 94.28% 和 97.74% 的準確率。
模型能力
文本分類
文本聚類
信息檢索
重排序
文本相似度計算
使用案例
電子商務
產品評論分類
用於對亞馬遜產品評論進行分類,識別正面和負面評價。
在 AmazonPolarityClassification 任務中達到 97.74% 的準確率。
反事實評論檢測
檢測亞馬遜上的反事實評論,幫助識別虛假或誤導性內容。
在 AmazonCounterfactualClassification 任務中達到 94.28% 的準確率。
學術研究
論文聚類
對 arXiv 和 bioRxiv 上的學術論文進行聚類,幫助研究人員發現相關研究。
在 ArxivClusteringP2P 和 BiorxivClusteringP2P 任務中分別達到 55.80% 和 54.09% 的 v_measure 分數。
技術支持
重複問題檢測
在 AskUbuntu 社區中檢測重複的技術問題,提高支持效率。
在 AskUbuntuDupQuestions 任務中達到 67.46% 的 map 分數。
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98