LENS D8000
L
LENS D8000
由yibinlei開發
LENS-8000 是一個基於轉換器的文本嵌入模型,專注於特徵提取和句子相似度任務,在多個分類和檢索任務中表現出色。
下載量 848
發布時間 : 12/30/2024
模型概述
LENS-8000 是一個高性能的文本嵌入模型,主要用於文本分類、句子相似度計算和特徵提取任務。它在 MTEB 基準測試中的多個數據集上展現了優異的性能。
模型特點
高性能文本分類
在多個文本分類任務中表現出色,如 Amazon 評論分類和情感分析。
強大的句子相似度計算
在句子相似度任務中表現優異,能夠準確計算文本之間的語義相似度。
多任務支持
支持多種 NLP 任務,包括分類、檢索和特徵提取。
模型能力
文本嵌入
特徵提取
句子相似度計算
文本分類
信息檢索
使用案例
電子商務
產品評論分類
對 Amazon 產品評論進行情感分析和分類。
在 AmazonPolarityClassification 任務中準確率達到 97.07%。
反事實評論檢測
識別 Amazon 上的反事實評論。
在 AmazonCounterfactualClassification 任務中準確率達到 93.69%。
信息檢索
論點檢索
在論點分析任務中檢索相關論點。
在 ArguAna 檢索任務中主要分數達到 76.019。
許可證:Apache-2.0
標籤:
- 文本嵌入
- 特徵提取
- 句子相似度
- 轉換器
- MTEB
模型索引:
- 名稱:Gouzi3618/LENS-8000
結果:-
任務:
類型:分類
數據集:
名稱:MTEB AmazonCounterfactualClassification(英文)
類型:mteb/amazon_counterfactual
配置:en
拆分:測試
修訂版本:e8379541af4e31359cca9fbcf4b00f2671dba205
指標:- 類型:準確率
值:93.6865671641791 - 類型:平均精度(AP)
值:74.44778735403261 - 類型:加權平均精度(AP)
值:74.44778735403261 - 類型:F1分數
值:90.57338628851295 - 類型:加權F1分數
值:93.87207694461506 - 類型:主要分數
值:93.6865671641791
- 類型:準確率
-
任務:
類型:分類
數據集:
名稱:MTEB AmazonPolarityClassification(默認)
類型:mteb/amazon_polarity
配置:默認
拆分:測試
修訂版本:e2d317d38cd51312af73b3d32a06d1a08b442046
指標:- 類型:準確率
值:97.06832499999999 - 類型:平均精度(AP)
值:95.71019538629211 - 類型:加權平均精度(AP)
值:95.71019538629211 - 類型:F1分數
值:97.06781792337515 - 類型:加權F1分數
值:97.06781792337515 - 類型:主要分數
值:97.06832499999999
- 類型:準確率
-
任務:
類型:分類
數據集:
名稱:MTEB AmazonReviewsClassification(英文)
類型:mteb/amazon_reviews_multi
配置:en
拆分:測試
修訂版本:1399c76144fd37290681b995c656ef9b2e06e26d
指標:- 類型:準確率
值:63.608 - 類型:F1分數
值:62.41274991021244 - 類型:加權F1分數
值:62.41274991021244 - 類型:主要分數
值:63.608
- 類型:準確率
-
任務:
類型:檢索
數據集:
名稱:MTEB ArguAna(默認)
類型:mteb/arguana
配置:默認
拆分:測試
修訂版本:c22ab2a51041ffd869aaddef7af8d8215647e41a
指標:- 類型:主要分數
值:76.019 - 類型:前1位平均精度(MAP@1)
值:55.903000000000006 - 類型:前10位平均精度(MAP@10)
值:69.887 - 類型:前100位平均精度(MAP@100)
值:70.157 - 類型:前1000位平均精度(MAP@1000)
值:70.159 - 類型:前20位平均精度(MAP@20)
值:70.101 - 類型:前3位平均精度(MAP@3)
值:67.378 - 類型:前5位平均精度(MAP@5)
值:69.138 - 類型:前1位平均倒數排名(MRR@1)
值:56.899004267425326 - 類型:前10位平均倒數排名(MRR@10)
值:70.23428503691676 - 類型:前100位平均倒數排名(MRR@100)
值:70.50477756895107 - 類型:前1000位平均倒數排名(MRR@1000)
值:70.5063694836776 - 類型:前20位平均倒數排名(MRR@20)
值:70.44906432331086 - 類型:前3位平均倒數排名(MRR@3)
值:67.73352299668105 - 類型:前5位平均倒數排名(MRR@5)
值:69.46183025130412 - 類型:前1000位標準化平均精度差異1(NAUC_MAP@1000_diff1)
值:28.369738335000932 - 類型:前1000位標準化平均精度最大值(NAUC_MAP@1000_max)
值:-6.46878252914094 - 類型:前1000位標準化平均精度標準差(NAUC_MAP@1000_std)
值:-31.433213242739523 - 類型:前100位標準化平均精度差異1(NAUC_MAP@100_diff1)
值:28.37160281520759 - 類型:前100位標準化平均精度最大值(NAUC_MAP@100_max)
值:-6.463942005621383 - 類型:前100位標準化平均精度標準差(NAUC_MAP@100_std)
值:-31.431652236686336 - 類型:前10位標準化平均精度差異1(NAUC_MAP@10_diff1)
值:28.30518291942587 - 類型:前10位標準化平均精度最大值(NAUC_MAP@10_max)
值:-6.194974102740169 - 類型:前10位標準化平均精度標準差(NAUC_MAP@10_std)
值:-31.325188430370922 - 類型:前1位標準化平均精度差異1(NAUC_MAP@1_diff1)
值:31.608647238057447 - 類型:前1位標準化平均精度最大值(NAUC_MAP@1_max)
值:-9.000938880640247 - 類型:前1位標準化平均精度標準差(NAUC_MAP@1_std)
值:-31.850340580223968 - 類型:前20位標準化平均精度差異1(NAUC_MAP@20_diff1)
值:28.36848638837624 - 類型:前20位標準化平均精度最大值(NAUC_MAP@20_max)
值:-6.412381430978799 - 類型:前20位標準化平均精度標準差(NAUC_MAP@20_std)
值:-31.452685362617505 - 類型:前3位標準化平均精度差異1(NAUC_MAP@3_diff1)
值:27.95089394680187 - 類型:前3位標準化平均精度最大值(NAUC_MAP@3_max)
值:-6.302015702313729 - 類型:前3位標準化平均精度標準差(NAUC_MAP@3_std)
值:-31.507334020085302 - 類型:前5位標準化平均精度差異1(NAUC_MAP@5_diff1)
值:27.982348077574986 - 類型:前5位標準化平均精度最大值(NAUC_MAP@5_max)
值:-6.006566315399395 - 類型:前5位標準化平均精度標準差(NAUC_MAP@5_std)
值:-31.34425541540422 - 類型:前1000位標準化平均倒數排名差異1(NAUC_MRR@1000_diff1)
值:25.227964866245816 - 類型:前1000位標準化平均倒數排名最大值(NAUC_MRR@1000_max)
值:-8.133964659261048 - 類型:前1000位標準化平均倒數排名標準差(NAUC_MRR@1000_std)
值:-31.624647211708368 - 類型:前100位標準化平均倒數排名差異1(NAUC_MRR@100_diff1)
值:25.230047265830933 - 類型:前100位標準化平均倒數排名最大值(NAUC_MRR@100_max)
值:-8.128997368626452 - 類型:前100位標準化平均倒數排名標準差(NAUC_MRR@100_std)
值:-31.623068694211064 - 類型:前10位標準化平均倒數排名差異1(NAUC_MRR@10_diff1)
值:25.204936229955173 - 類型:前10位標準化平均倒數排名最大值(NAUC_MRR@10_max)
值:-7.835563207660743 - 類型:前10位標準化平均倒數排名標準差(NAUC_MRR@10_std)
值:-31.513346742425636 - 類型:前1位標準化平均倒數排名差異1(NAUC_MRR@1_diff1)
值:28.89704784792216 - 類型:前1位標準化平均倒數排名最大值(NAUC_MRR@1_max)
值:-9.311272900405159 - 類型:前1位標準化平均倒數排名標準差(NAUC_MRR@1_std)
值:-32.309921279147936 - 類型:前20位標準化平均倒數排名差異1(NAUC_MRR@20_diff1)
值:25.234339492194795 - 類型:前20位標準化平均倒數排名最大值(NAUC_MRR@20_max)
值:-8.07335487193087 - 類型:前20位標準化平均倒數排名標準差(NAUC_MRR@20_std)
值:-31.643711223846516 - 類型:前3位標準化平均倒數排名差異1(NAUC_MRR@3_diff1)
值:24.876431359680033 - 類型:前3位標準化平均倒數排名最大值(NAUC_MRR@3_max)
值:-8.195519132024183 - 類型:前3位標準化平均倒數排名標準差(NAUC_MRR@3_std)
值:-32.11957727976911 - 類型:前5位標準化平均倒數排名差異1(NAUC_MRR@5_diff1)
值:24.88764812242424 - 類型:前5位標準化平均倒數排名最大值(NAUC_MRR@5_max)
值:-7.7576769931519465 - 類型:前5位標準化平均倒數排名標準差(NAUC_MRR@5_std)
值:-31.564378631881564 - 類型:前1000位標準化歸一化折損累積增益差異1(NAUC_NDCG@1000_diff1)
值:28.09257580244486 - 類型:前1000位標準化歸一化折損累積增益最大值(NAUC_NDCG@1000_max)
值:-5.74562709568006 - 類型:前1000位標準化歸一化折損累積增益標準差(NAUC_NDCG@1000_std)
值:-30.918202197214672 - 類型:前100位標準化歸一化折損累積增益差異1(NAUC_NDCG@100_diff1)
值:28.134375117688613 - 類型:前100位標準化歸一化折損累積增益最大值(NAUC_NDCG@100_max)
值:-5.622192790763758 - 類型:前100位標準化歸一化折損累積增益標準差(NAUC_NDCG@100_std)
值:-30.85960292081723 - 類型:前10位標準化歸一化折損累積增益差異1(NAUC_NDCG@10_diff1)
值:27.87869834059295 - 類型:前10位標準化歸一化折損累積增益最大值(NAUC_NDCG@10_max)
值:-4.2662724404197725 - 類型:前10位標準化歸一化折損累積增益標準差(NAUC_NDCG@10_std)
值:-30.429941458615485 - 類型:前1位標準化歸一化折損累積增益差異1(NAUC_NDCG@1_diff1)
值:31.608647238057447 - 類型:前1位標準化歸一化折損累積增益最大值(NAUC_NDCG@1_max)
值:-9.000938880640247 - 類型:前1位標準化歸一化折損累積增益標準差(NAUC_NDCG@1_std)
值:-31.850340580223968 - 類型:前20位標準化歸一化折損累積增益差異1(NAUC_NDCG@20_diff1)
值:28.114701479308486 - 類型:前20位標準化歸一化折損累積增益最大值(NAUC_NDCG@20_max)
值:-5.185807260199579 - 類型:前20位標準化歸一化折損累積增益標準差(NAUC_NDCG@20_std)
值:-30.881592179360815 - 類型:前3位標準化歸一化折損累積增益差異1(NAUC_NDCG@3_diff1)
值:27.090519410510677 - 類型:前3位標準化歸一化折損累積增益最大值(NAUC_NDCG@3_max)
值:-4.699103690447523 - 類型:前3位標準化歸一化折損累積增益標準差(NAUC_NDCG@3_std)
值:-31.00974723525509 - 類型:前5位標準化歸一化折損累積增益差異1(NAUC_NDCG@5_diff1)
值:27.06577902395562 - 類型:前5位標準化歸一化折損累積增益最大值(NAUC_NDCG@5_max)
值:-3.896494379869019 - 類型:前5位標準化歸一化折損累積增益標準差(NAUC_NDCG@5_std)
值:-30.595264634140477 - 類型:前1000位標準化精確率差異1(NAUC_Precision@1000_diff1)
值:13.625066205876864 - 類型:前1000位標準化精確率最大值(NAUC_Precision@1000_max)
值:31.077851886953717 - 類型:前1000位標準化精確率標準差(NAUC_Precision@1000_std)
值:47.82408874251543 - 類型:前100位標準化精確率差異1(NAUC_Precision@100_diff1)
值:28.334166321212894 - 類型:前100位標準化精確率最大值(NAUC_Precision@100_max)
值:45.958982731935635 - 類型:前100位標準化精確率標準差(NAUC_Precision@100_std)
值:33.156399537789966 - 類型:前10位標準化精確率差異1(NAUC_Precision@10_diff1)
值:24.44965698632213 - 類型:前10位標準化精確率最大值(NAUC_Precision@10_max)
值:22.187375935245363 - 類型:前10位標準化精確率標準差(NAUC_Precision@10_std)
值:-17.084349043862684 - 類型:前1位標準化精確率差異1(NAUC_Precision@1_diff1)
值:31.608647238057447 - 類型:前1位標準化精確率最大值(NAUC_Precision@1_max)
值:-9.000938880640247 - 類型:前1位標準化精確率標準差(NAUC_Precision@1_std)
值:-31.850340580223968 - 類型:前20位標準化精確率差異1(NAUC_Precision@20_diff1)
值:27.146201764531284 - 類型:前20位標準化精確率最大值(NAUC_Precision@20_max)
值:26.77044396290566 - 類型:前20位標準化精確率標準差(NAUC_Precision@20_std)
值:-12.639636692077305 - 類型:前3位標準化精確率差異1(NAUC_Precision@3_diff1)
值:23.662213602558584 - 類型:前3位標準化精確率最大值(NAUC_Precision@3_max)
值:2.466959457953989 - 類型:前3位標準化精確率標準差(NAUC_Precision@3_std)
值:-28.691552875980207 - 類型:前5位標準化精確率差異1(NAUC_Precision@5_diff1)
值:21.42559683194896 - 類型:前5位標準化精確率最大值(NAUC_Precision@5_max)
值:10.877697931273545 - 類型:前5位標準化精確率標準差(NAUC_Precision@5_std)
值:-25.1444110698694 - 類型:前1000位標準化召回率差異1(NAUC_Recall@1000_diff1)
值:13.625066205870539 - 類型:前1000位標準化召回率最大值(NAUC_Recall@1000_max)
值:31.077851886952303 - 類型:前1000位標準化召回率標準差(NAUC_Recall@1000_std)
值:47.82408874251562 - 類型:前100位標準化召回率差異1(NAUC_Recall@100_diff1)
值:28.33416632120962 - 類型:前100位標準化召回率最大值(NAUC_Recall@100_max)
值:45.958982731932394 - 類型:前100位標準化召回率標準差(NAUC_Recall@100_std)
值:33.15639953779121 - 類型:前10位標準化召回率差異1(NAUC_Recall@10_diff1)
值:24.449656986321795 - 類型:前10位標準化召回率最大值(NAUC_Recall@10_max)
值:22.18737593524522 - 類型:前10位標準化召回率標準差(NAUC_Recall@10_std)
值:-17.084349043862865 - 類型:前1位標準化召回率差異1(NAUC_Recall@1_diff1)
值:31.608647238057447 - 類型:前1位標準化召回率最大值(NAUC_Recall@1_max)
值:-9.000938880640247 - 類型:前1位標準化召回率標準差(NAUC_Recall@1_std)
值:-31.850340580223968 - 類型:前20位標準化召回率差異1(NAUC_Recall@20_diff1)
值:27.146201764531586 - 類型:前20位標準化召回率最大值(NAUC_Recall@20_max)
值:26.770443962904633 - 類型:前20位標準化召回率標準差(NAUC_Recall@20_std)
值:-12.639636692076802 - 類型:前3位標準化召回率差異1(NAUC_Recall@3_diff1)
值:23.66221360255874 - 類型:前3位標準化召回率最大值(NAUC_Recall@3_max)
值:2.466959457954044 - 類型:前3位標準化召回率標準差(NAUC_Recall@3_std)
值:-28.691552875980115 - 類型:前5位標準化召回率差異1(NAUC_Recall@5_diff1)
值:21.425596831948823 - 類型:前5位標準化召回率最大值(NAUC_Recall@5_max)
值:10.87769793127329 - 類型:前5位標準化召回率標準差(NAUC_Recall@5_std)
值:-25.144411069869477 - 類型:前1位歸一化折損累積增益(NDCG@1)
值:55.903000000000006 - 類型:前10位歸一化折損累積增益(NDCG@10)
值:76.019 - 類型:前100位歸一化折損累積增益(NDCG@100)
值:77.102 - 類型:前1000位歸一化折損累積增益(NDCG@1000)
值:77.132 - 類型:前20位歸一化折損累積增益(NDCG@20)
值:76.77199999999999 - 類型:前3位歸一化折損累積增益(NDCG@3)
值:71.032 - 類型:前5位歸一化折損累積增益(NDCG@5)
值:74.22999999999999 - 類型:前1位精確率(Precision@1)
值:55.903000000000006 - 類型:前10位精確率(Precision@10)
值:9.488000000000001
- 類型:主要分數
-
Jina Embeddings V3
Jina Embeddings V3 是一個多語言句子嵌入模型,支持超過100種語言,專注於句子相似度和特徵提取任務。
文本嵌入
Transformers 支持多種語言

J
jinaai
3.7M
911
Ms Marco MiniLM L6 V2
Apache-2.0
基於MS Marco段落排序任務訓練的交叉編碼器模型,用於信息檢索中的查詢-段落相關性評分
文本嵌入 英語
M
cross-encoder
2.5M
86
Opensearch Neural Sparse Encoding Doc V2 Distill
Apache-2.0
基於蒸餾技術的稀疏檢索模型,專為OpenSearch優化,支持免推理文檔編碼,在搜索相關性和效率上優於V1版本
文本嵌入
Transformers 英語

O
opensearch-project
1.8M
7
Sapbert From PubMedBERT Fulltext
Apache-2.0
基於PubMedBERT的生物醫學實體表徵模型,通過自對齊預訓練優化語義關係捕捉
文本嵌入 英語
S
cambridgeltl
1.7M
49
Gte Large
MIT
GTE-Large 是一個強大的句子轉換器模型,專注於句子相似度和文本嵌入任務,在多個基準測試中表現出色。
文本嵌入 英語
G
thenlper
1.5M
278
Gte Base En V1.5
Apache-2.0
GTE-base-en-v1.5 是一個英文句子轉換器模型,專注於句子相似度任務,在多個文本嵌入基準測試中表現優異。
文本嵌入
Transformers 支持多種語言

G
Alibaba-NLP
1.5M
63
Gte Multilingual Base
Apache-2.0
GTE Multilingual Base 是一個多語言的句子嵌入模型,支持超過50種語言,適用於句子相似度計算等任務。
文本嵌入
Transformers 支持多種語言

G
Alibaba-NLP
1.2M
246
Polybert
polyBERT是一個化學語言模型,旨在實現完全由機器驅動的超快聚合物信息學。它將PSMILES字符串映射為600維密集指紋,以數值形式表示聚合物化學結構。
文本嵌入
Transformers

P
kuelumbus
1.0M
5
Bert Base Turkish Cased Mean Nli Stsb Tr
Apache-2.0
基於土耳其語BERT的句子嵌入模型,專為語義相似度任務優化
文本嵌入
Transformers 其他

B
emrecan
1.0M
40
GIST Small Embedding V0
MIT
基於BAAI/bge-small-en-v1.5模型微調的文本嵌入模型,通過MEDI數據集與MTEB分類任務數據集訓練,優化了檢索任務的查詢編碼能力。
文本嵌入
Safetensors 英語
G
avsolatorio
945.68k
29
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98