Cde Small V1
C
Cde Small V1
由OrcaDB開發
cde-small-v1 是一個基於 transformer 架構的小型句子嵌入模型,在多個文本分類、聚類和檢索任務上表現出色。
下載量 90.62k
發布時間 : 11/8/2024
模型概述
該模型主要用於文本分類、聚類和檢索任務,支持英語文本處理,在 MTEB 基準測試中表現良好。
模型特點
多任務性能優異
在文本分類、聚類和檢索等多種任務上均表現良好
高效的小型模型
作為小型模型,在保持性能的同時具有較高的效率
MTEB基準測試驗證
在多個MTEB基準測試數據集上進行了全面評估
模型能力
文本分類
文本聚類
信息檢索
句子相似度計算
文本重排序
使用案例
電子商務
亞馬遜評論分類
對亞馬遜商品評論進行情感分析和分類
在亞馬遜極性分類任務上達到94.66%準確率
反事實評論識別
識別亞馬遜上的反事實評論
在亞馬遜反事實分類任務上達到87.03%準確率
金融
銀行客戶服務分類
對銀行客戶諮詢進行分類
在Banking77數據集上達到88.58%準確率
學術研究
論文聚類
對學術論文進行主題聚類
在arXiv論文聚類任務上達到48.63 V-measure
標籤:
- mteb
- transformers
- sentence-transformers 模型索引:
- 名稱: cde-small-v1
結果:
- 數據集:
配置: en
名稱: MTEB 亞馬遜反事實分類 (en)
版本: e8379541af4e31359cca9fbcf4b00f2671dba205
拆分: 測試
類型: mteb/amazon_counterfactual
指標:
- 類型: 準確率 值: 87.02985074626866
- 類型: 平均精度 值: 56.706190238632956
- 類型: 加權平均精度 值: 56.706190238632956
- 類型: F1分數 值: 81.93161953007674
- 類型: 加權F1分數 值: 87.7650174177188
- 類型: 主要得分 值: 87.02985074626866 任務: 類型: 分類
- 數據集:
配置: 默認
名稱: MTEB 亞馬遜極性分類 (默認)
版本: e2d317d38cd51312af73b3d32a06d1a08b442046
拆分: 測試
類型: mteb/amazon_polarity
指標:
- 類型: 準確率 值: 94.664175
- 類型: 平均精度 值: 91.68668057762052
- 類型: 加權平均精度 值: 91.68668057762052
- 類型: F1分數 值: 94.65859470333152
- 類型: 加權F1分數 值: 94.65859470333152
- 類型: 主要得分 值: 94.664175 任務: 類型: 分類
- 數據集:
配置: en
名稱: MTEB 亞馬遜評論分類 (en)
版本: 1399c76144fd37290681b995c656ef9b2e06e26d
拆分: 測試
類型: mteb/amazon_reviews_multi
指標:
- 類型: 準確率 值: 55.762
- 類型: F1分數 值: 55.06427827477677
- 類型: 加權F1分數 值: 55.06427827477677
- 類型: 主要得分 值: 55.762 任務: 類型: 分類
- 數據集:
配置: 默認
名稱: MTEB ArguAna (默認)
版本: c22ab2a51041ffd869aaddef7af8d8215647e41a
拆分: 測試
類型: mteb/arguana
指標:
- 類型: 主要得分 值: 71.99600000000001
- 類型: 前1位平均精度 值: 49.004
- 類型: 前10位平均精度 值: 64.741
- 類型: 前100位平均精度 值: 65.045
- 類型: 前1000位平均精度 值: 65.048
- 類型: 前20位平均精度 值: 64.999
- 類型: 前3位平均精度 值: 61.344
- 類型: 前5位平均精度 值: 63.595
- 類型: 前1位平均倒數排名 值: 50.71123755334281
- 類型: 前10位平均倒數排名 值: 65.32688703741336
- 類型: 前100位平均倒數排名 值: 65.63793917015693
- 類型: 前1000位平均倒數排名 值: 65.64038101143724
- 類型: 前20位平均倒數排名 值: 65.59178002869953
- 類型: 前3位平均倒數排名 值: 61.960644855381695
- 類型: 前5位平均倒數排名 值: 64.12636320531058
- 類型: nauc_前1000位平均精度_diff1 值: 15.961240220366024
- 類型: nauc_前1000位平均精度_max 值: -7.44765810583741
- 類型: nauc_前1000位平均精度_std 值: -17.07167824225605
- 類型: nauc_前100位平均精度_diff1 值: 15.965616911760689
- 類型: nauc_前100位平均精度_max 值: -7.440609797442297
- 類型: nauc_前100位平均精度_std 值: -17.069175070766125
- 類型: nauc_前10位平均精度_diff1 值: 16.0053641689455
- 類型: nauc_前10位平均精度_max 值: -7.292003400856069
- 類型: nauc_前10位平均精度_std 值: -17.21891231777586
- 類型: nauc_前1位平均精度_diff1 值: 16.775859614223965
- 類型: nauc_前1位平均精度_max 值: -10.812150486389175
- 類型: nauc_前1位平均精度_std 值: -18.447209756110635
- 類型: nauc_前20位平均精度_diff1 值: 16.00477985164213
- 類型: nauc_前20位平均精度_max 值: -7.344399709169316
- 類型: nauc_前20位平均精度_std 值: -17.011815937847548
- 類型: nauc_前3位平均精度_diff1 值: 15.730294091913994
- 類型: nauc_前3位平均精度_max 值: -7.13902722192326
- 類型: nauc_前3位平均精度_std 值: -16.846251134000045
- 類型: nauc_前5位平均精度_diff1 值: 15.952653874864062
- 類型: nauc_前5位平均精度_max 值: -6.730509527119155
- 類型: nauc_前5位平均精度_std 值: -16.586379153220353
- 類型: nauc_前1000位平均倒數排名_diff1 值: 10.221278338563085
- 類型: nauc_前1000位平均倒數排名_max 值: -10.513831642963527
- 類型: nauc_前1000位平均倒數排名_std 值: -16.340880407651863
- 類型: nauc_前100位平均倒數排名_diff1 值: 10.226217465992063
- 類型: nauc_前100位平均倒數排名_max 值: -10.506478667638874
- 類型: nauc_前100位平均倒數排名_std 值: -16.33847358633176
- 類型: nauc_前10位平均倒數排名_diff1 值: 10.293491655887369
- 類型: nauc_前10位平均倒數排名_max 值: -10.357229664747909
- 類型: nauc_前10位平均倒數排名_std 值: -16.496874845739885
- 類型: nauc_前1位平均倒數排名_diff1 值: 12.049863016253427
- 類型: nauc_前1位平均倒數排名_max 值: -11.968579522299635
- 類型: nauc_前1位平均倒數排名_std 值: -16.65245790056632
- 類型: nauc_前20位平均倒數排名_diff1 值: 10.276109067921565
- 類型: nauc_前20位平均倒數排名_max 值: -10.404100283652397
- 類型: nauc_前20位平均倒數排名_std 值: -16.282098762560164
- 類型: nauc_前3位平均倒數排名_diff1 值: 10.338008940592475
- 類型: nauc_前3位平均倒數排名_max 值: -10.123508259477648
- 類型: nauc_前3位平均倒數排名_std 值: -16.218834894850918
- 類型: nauc_前5位平均倒數排名_diff1 值: 10.114375457049043
- 類型: nauc_前5位平均倒數排名_max 值: -9.987361588255437
- 類型: nauc_前5位平均倒數排名_std 值: -15.723897501895118
- 類型: nauc_前1000位歸一化折損累積增益_diff1 值: 16.00889445347496
- 類型: nauc_前1000位歸一化折損累積增益_max 值: -6.746746500535893
- 類型: nauc_前1000位歸一化折損累積增益_std 值: -16.567047531839382
- 類型: nauc_前100位歸一化折損累積增益_diff1 值: 16.10719535312808
- 類型: nauc_前100位歸一化折損累積增益_max 值: -6.59354665730934
- 類型: nauc_前100位歸一化折損累積增益_std 值: -16.513298001700566
- 類型: nauc_前10位歸一化折損累積增益_diff1 值: 16.396485814351973
- 類型: nauc_前10位歸一化折損累積增益_max 值: -5.7111859345525895
- 類型: nauc_前10位歸一化折損累積增益_std 值: -17.13416103510026
- 類型: nauc_前1位歸一化折損累積增益_diff1 值: 16.775859614223965
- 類型: nauc_前1位歸一化折損累積增益_max 值: -10.812150486389175
- 類型: nauc_前1位歸一化折損累積增益_std 值: -18.447209756110635
- 類型: nauc_前20位歸一化折損累積增益_diff1 值: 16.414235526534497
- 類型: nauc_前20位歸一化折損累積增益_max 值: -5.890463457153039
- 類型: nauc_前20位歸一化折損累積增益_std 值: -16.124783371499017
- 類型: nauc_前3位歸一化折損累積增益_diff1 值: 15.683431770601713
- 類型: nauc_前3位歸一化折損累積增益_max 值: -5.546675513691499
- 類型: nauc_前3位歸一化折損累積增益_std 值: -15.973244504586676
- 類型: nauc_前5位歸一化折損累積增益_diff1 值: 16.193847874581166
- 類型: nauc_前5位歸一化折損累積增益_max 值: -4.471638454091411
- 類型: nauc_前5位歸一化折損累積增益_std 值: -15.517824617814629
- 類型: nauc_前1000位精確度_diff1 值: 3.170440311533737
- 類型: nauc_前1000位精確度_max 值: 25.521992526080666
- 類型: nauc_前1000位精確度_std 值: 68.4373013145641
- 類型: nauc_前100位精確度_diff1 值: 30.283338663457897
- 類型: nauc_前100位精確度_max 值: 44.33747104624998
- 類型: nauc_前100位精確度_std 值: 42.28887350925609
- 類型: nauc_前10位精確度_diff1 值: 23.390956301235633
- 類型: nauc_前10位精確度_max 值: 15.468288261126773
- 類型: nauc_前10位精確度_std 值: -18.2942744669977
- 類型: nauc_前1位精確度_diff1 值: 16.775859614223965
- 類型: nauc_前1位精確度_max 值: -10.812150486389175
- 類型: nauc_前1位精確度_std 值: -18.447209756110635
- 類型: nauc_前20位精確度_diff1 值: 37.14254275219614
- 類型: nauc_前20位精確度_max 值: 46.984729023754824
- 類型: nauc_前20位精確度_std 值: 22.763524786900717
- 類型: nauc_前3位精確度_diff1 值: 15.651406928218881
- 類型: nauc_前3位精確度_max 值: 0.7775458885343681
- 類型: nauc_前3位精確度_std 值: -12.438132482295773
- 類型: nauc_前5位精確度_diff1 值: 18.10074574210355
- 類型: nauc_前5位精確度_max 值: 9.373350504221532
- 類型: nauc_前5位精確度_std 值: -9.13125987784625
- 類型: nauc_前1000位召回率_diff1 值: 3.1704403115262325
- 類型: nauc_前1000位召回率_max 值: 25.521992526077756
- 類型: nauc_前1000位召回率_std 值: 68.4373013145603
- 類型: nauc_前100位召回率_diff1 值: 30.283338663455616
- 類型: nauc_前100位召回率_max 值: 44.337471046250556
- 類型: nauc_前100位召回率_std 值: 42.28887350925341
- 類型: nauc_前10位召回率_diff1 值: 23.390956301235168
- 類型: nauc_前10位召回率_max 值: 15.468288261126578
- 類型: nauc_前10位召回率_std 值: -18.294274466997873
- 類型: nauc_前1位召回率_diff1 值: 16.775859614223965
- 類型: nauc_前1位召回率_max 值: -10.812150486389175
- 類型: nauc_前1位召回率_std 值: -18.447209756110635
- 類型: nauc_前20位召回率_diff1 值: 37.14254275219513
- 類型: nauc_前20位召回率_max 值: 46.98472902375421
- 類型: nauc_前20位召回率_std 值: 22.763524786899644
- 類型: nauc_前3位召回率_diff1 值: 15.65140692821902
- 類型: nauc_前3位召回率_max 值: 0.7775458885343522
- 類型: nauc_前3位召回率_std 值: -12.43813248229578
- 類型: nauc_前5位召回率_diff1 值: 18.10074574210355
- 類型: nauc_前5位召回率_max 值: 9.373350504221595
- 類型: nauc_前5位召回率_std 值: -9.131259877846116
- 類型: 前1位歸一化折損累積增益 值: 49.004
- 類型: 前10位歸一化折損累積增益 值: 71.99600000000001
- 類型: 前100位歸一化折損累積增益 值: 73.173
- 類型: 前1000位歸一化折損累積增益 值: 73.214
- 類型: 前20位歸一化折損累積增益 值: 72.91
- 類型: 前3位歸一化折損累積增益 值: 65.21900000000001
- 類型: 前5位歸一化折損累積增益 值: 69.284
- 類型: 前1位精確度 值: 49.004
- 類型: 前10位精確度 值: 9.452
- 類型: 前100位精確度 值: 0.9939999999999999
- 類型: 前1000位精確度 值: 0.1
- 類型: 前20位精確度 值: 4.904
- 類型: 前3位精確度 值: 25.462
- 類型: 前5位精確度 值: 17.255000000000003
- 類型: 前1位召回率 值: 49.004
- 類型: 前10位召回率 值: 94.523
- 類型: 前100位召回率 值: 99.36
- 類型: 前1000位召回率 值: 99.644
- 類型: 前20位召回率 值: 98.08
- 類型: 前3位召回率 值: 76.387
- 類型: 前5位召回率 值: 86.273 任務: 類型: 檢索
- 數據集:
配置: 默認
名稱: MTEB 論文聚類P2P (默認)
版本: a122ad7f3f0291bf49cc6f4d32aa80929df69d5d
拆分: 測試
類型: mteb/arxiv-clustering-p2p
指標:
- 類型: 主要得分 值: 48.629569816593516
- 類型: V度量 值: 48.629569816593516
- 類型: V度量標準差 值: 14.01810149072028 任務: 類型: 聚類
- 數據集:
配置: 默認
名稱: MTEB 論文聚類S2S (默認)
版本: f910caf1a6075f7329cdf8c1a6135696f37dbd53
拆分: 測試
類型: mteb/arxiv-clustering-s2s
指標:
- 類型: 主要得分 值: 40.52366904677561
- 類型: V度量 值: 40.52366904677561
- 類型: V度量標準差 值: 14.375876773823757 任務: 類型: 聚類
- 數據集:
配置: 默認
名稱: MTEB AskUbuntu重複問題 (默認)
版本: 2000358ca161889fa9c082cb41daa8dcfb161a54
拆分: 測試
類型: mteb/askubuntudupquestions-reranking
指標:
- 類型: 主要得分 值: 61.27347206107508
- 類型: 平均精度 值: 61.27347206107508
- 類型: 平均倒數排名 值: 74.49105219188321
- 類型: nAUC_平均精度_diff1 值: 13.442645655149457
- 類型: nAUC_平均精度_max 值: 25.013363268430027
- 類型: nAUC_平均精度_std 值: 17.60175231611674
- 類型: nAUC_平均倒數排名_diff1 值: 25.217675209249435
- 類型: nAUC_平均倒數排名_max 值: 32.37381560372622
- 類型: nAUC_平均倒數排名_std 值: 22.584922632508412 任務: 類型: 重排序
- 數據集:
配置: 默認
名稱: MTEB BIOSSES (默認)
版本: d3fb88f8f02e40887cd149695127462bbcf29b4a
拆分: 測試
類型: mteb/biosses-sts
指標:
- 類型: 餘弦皮爾遜 值: 89.09452267906886
- 類型: 餘弦斯皮爾曼 值: 86.73450642504955
- 類型: 歐幾里得皮爾遜 值: 87.1275130552617
- 類型: 歐幾里德斯皮爾曼 值: 86.93812552248012
- 類型: 主要得分 值: 86.73450642504955
- 類型: 曼哈頓皮爾遜 值: 86.79403606129864
- 類型: 曼哈頓斯皮爾曼 值: 86.76824213349957
- 類型: 皮爾遜 值: 89.09452267906886
- 類型: 斯皮爾曼 值: 86.73450642504955 任務: 類型: STS
- 數據集:
配置: 默認
名稱: MTEB Banking77分類 (默認)
版本: 0fd18e25b25c072e09e0d92ab615fda904d66300
拆分: 測試
類型: mteb/banking77
指標:
- 類型: 準確率 值: 88.58116883116884
- 類型: F1分數 值: 88.54536316207125
- 類型: 加權F1分數 值: 88.54536316207125
- 類型: 主要得分 值: 88.58116883116884 任務: 類型: 分類
- 數據集:
配置: 默認
名稱: MTEB Biorxiv聚類P2P (默認)
版本: 65b79d1d13f80053f67aca9498d9402c2d9f1f40
拆分: 測試
類型: mteb/biorxiv-clustering-p2p
指標:
- 類型: 主要得分 值: 44.89554099528695
- 類型: V度量 值: 44.89554099528695
- 類型: V度量標準差 值: 0.6101675839696261 任務: 類型: 聚類
- 數據集:
配置: 默認
名稱: MTEB Biorxiv聚類S2S (默認)
版本: 258694dd0231531bc1fd9de6ceb52a0853c6d908
拆分: 測試
類型: mteb/biorxiv-clustering-s2s
指標:
- 類型: 主要得分 值: 37.89775676199564
- 類型: V度量 值: 37.89775676199564
- 類型: V度量標準差 值: 0.6980439644171996 任務: 類型: 聚類
- 數據集:
配置: 默認
名稱: MTEB CQADupstackAndroid檢索 (默認)
版本: f46a197baaae43b4f621051089b82a364682dfeb
拆分: 測試
類型: mteb/cqadupstack-android
指標:
- 類型: 主要得分 值: 49.239
- 類型: 前1位平均精度 值: 31.407
- 類型: 前10位平均精度 值: 42.788
- 類型: 前100位平均精度 值: 44.163999999999994
- 類型: 前1000位平均精度 值: 44.285000000000004
- 類型: 前20位平均精度 值: 43.531
- 類型: 前3位平均精度 值: 39.381
- 類型: 前5位平均精度 值: 41.296
- 類型: 前1位平均倒數排名 值: 38.91273247496424
- 類型: 前10位平均倒數排名 值: 48.82553307446011
- 類型: 前100位平均倒數排名 值: 49.5278584841276
- 類型: 前1000位平均倒數排名 值: 49.56897938168851
- 類型: 前20位平均倒數排名 值: 49.27034318525701
- 類型: 前3位平均倒數排名 值: 46.423462088698145
- 類型: 前5位平均倒數排名 值: 47.83261802575108
- 類型: nauc_前1000位平均精度_diff1 值: 51.50772644391144
- 類型: nauc_前1000位平均精度_max 值: 39.57698592158747
- 類型: nauc_前1000位平均精度_std 值: -5.092734127689174
- 類型: nauc_前100位平均精度_diff1 值: 51.51650908644926
- 類型: nauc_前100位平均精度_max 值: 39.579607215550325
- 類型: nauc_前100位平均精度_std 值: -5.112306014245407
- 類型: nauc_前10位平均精度_diff1 值: 51.80732269410239
- 類型: nauc_前10位平均精度_max 值: 39.312012392020854
- 類型: nauc_前10位平均精度_std 值: -5.844192947783184
- 類型: nauc_前1位平均精度_diff1 值: 58.51885994004338
- 類型: nauc_前1位平均精度_max 值: 35.306905646597656
- 類型: nauc_前1位平均精度_std 值: -6.4627870729629455
- 類型: nauc_前20位平均精度_diff1 值: 51.560698537725294
- 類型: nauc_前20位平均精度_max 值: 39.40865218451427
- 類型: nauc_前20位平均精度_std 值: -5.46140640509653
- 類型: nauc_前3位平均精度_diff1 值: 52.845784777873305
- 類型: nauc_前3位平均精度_max 值: 38.55976877563459
- 類型: nauc_前3位平均精度_std 值: -5.72430771104222
- 類型: nauc_前5位平均精度_diff1 值: 52.29343919325049
- 類型: nauc_前5位平均精度_max 值: 38.98194700024613
- 類型: nauc_前5位平均精度_std 值: -6.062278166282727
- 類型: nauc_前1000位平均倒數排名_diff1 值: 48.824012243253904
- 類型: nauc_前1000位平均倒數排名_max 值: 40.36119735345816
- 類型: nauc_前1000位平均倒數排名_std 值: -4.371172318529068
- 類型: nauc_前100位平均倒數排名_diff1 值: 48.80142209066577
- 類型: nauc_前100位平均倒數排名_max 值: 40.35371141231279
- 類型: nauc_前100位平均倒數排名_std 值: -4.382000140837231
- 類型: nauc_前10位平均倒數排名_diff1 值: 48.89408963706152
- 類型: nauc_前10位平均倒數排名_max 值: 40.48043029859513
- 類型: nauc_前10位平均倒數排名_std 值: -4.5927306729163835
- 類型: nauc_前1位平均倒數排名_diff1 值: 53.18491414251319
- 類型: nauc_前1位平均倒數排名_max 值: 38.43746618754316
- 類型: nauc_前1位平均倒數排名_std 值: -6.2489159406458965
- 類型: nauc_前20位平均倒數排名_diff1 值: 48.763867640789634
- 類型: nauc_前20位平均倒數排名_max 值: 40.369114351255135
- 類型: nauc_前20位平均倒數排名_std 值: -4.400065130027329
- 類型: nauc_前3位平均倒數排名_diff1 值: 48.87375252127912
- 類型: nauc_前3位平均倒數排名_max 值: 40.810763259212116
- 類型: nauc_前3位平均倒數排名_std 值: -3.4938483699692657
- 類型: nauc_前5位平均倒數排名_diff1 值: 49.186967577714285
- 類型: nauc_前5位平均倒數排名_max 值: 40.48882253846611
- 類型: nauc_前5位平均倒數排名_std 值: -4.621076155915746
- 類型: nauc_前1000位歸一化折損累積增益_diff1 值: 49.24642669558249
- 類型: nauc_前1000位歸一化折損累積增益_max 值: 41.00404222082434
- 類型: nauc_前1000位歸一化折損累積增益_std 值: -2.7356065308278392
- 類型: nauc_前100位歸一化折損累積增益_diff1 值: 48.92939354546236
- 類型: nauc_前100位歸一化折損累積增益_max 值: 40.972699158281586
- 類型: nauc_前100位歸一化折損累積增益_std 值: -3.0561983632108776
- 類型: nauc_前10位歸一化折損累積增益_diff1 值: 49.60179215238792
- 類型: nauc_前10位歸一化折損累積增益_max 值: 40.89678771623847
- 類型: nauc_前10位歸一化折損累積增益_std 值: -5.096633756025252
- 類型: nauc_前1位歸一化折損累積增益_diff1 值: 53.18491414251319
- 類型: nauc_前1位歸一化折損累積增益_max 值: 38.43746618754316
- 類型: nauc_前1位歸一化折損累積增益_std 值: -6.2489159406458965
- 類型: nauc_前20位歸一化折損累積增益_diff1 值: 48.826483305583984
- 類型: nauc_前20位歸一化折損累積增益_max 值: 40.592200374154466
- 類型: nauc_前20位歸一化折損累積增益_std 值: -4.185196398682058
- 類型: nauc_前3位歸一化折損累積增益_diff1 值: 49.9798291819845
- 類型: nauc_前3位歸一化折損累積增益_max 值: 40.50211559049151
- 類型: nauc_前3位歸一化折損累積增益_std 值: -3.9606100546649
- 類型: nauc_前5位歸一化折損累積增益_diff1 值: 50.222364976292454
- 類型: nauc_前5位歸一化折損累積增益_max 值: 40.477461845726694
- 類型: nauc_前5位歸一化折損累積增益_std 值: -5.025922873253527
- 類型: nauc_前1000位精確度_diff1 值: -24.208256297106363
- 類型: nauc_前1000位精確度_max 值: -10.21103761078881
- 類型: nauc_前1000位精確度_std 值: -0.06753142735419307
- 類型: nauc_前100位精確度_diff1 值: -15.392095697703853
- 類型: nauc_前100位精確度_max 值: 3.3764259600400375
- 類型: nauc_前100位精確度_std 值: 7.032273000803224
- 類型: nauc_前10位精確度_diff1 值: 8.050911372676126
- 類型: nauc_前10
- 數據集:
配置: en
名稱: MTEB 亞馬遜反事實分類 (en)
版本: e8379541af4e31359cca9fbcf4b00f2671dba205
拆分: 測試
類型: mteb/amazon_counterfactual
指標:
Jina Embeddings V3
Jina Embeddings V3 是一個多語言句子嵌入模型,支持超過100種語言,專注於句子相似度和特徵提取任務。
文本嵌入
Transformers 支持多種語言

J
jinaai
3.7M
911
Ms Marco MiniLM L6 V2
Apache-2.0
基於MS Marco段落排序任務訓練的交叉編碼器模型,用於信息檢索中的查詢-段落相關性評分
文本嵌入 英語
M
cross-encoder
2.5M
86
Opensearch Neural Sparse Encoding Doc V2 Distill
Apache-2.0
基於蒸餾技術的稀疏檢索模型,專為OpenSearch優化,支持免推理文檔編碼,在搜索相關性和效率上優於V1版本
文本嵌入
Transformers 英語

O
opensearch-project
1.8M
7
Sapbert From PubMedBERT Fulltext
Apache-2.0
基於PubMedBERT的生物醫學實體表徵模型,通過自對齊預訓練優化語義關係捕捉
文本嵌入 英語
S
cambridgeltl
1.7M
49
Gte Large
MIT
GTE-Large 是一個強大的句子轉換器模型,專注於句子相似度和文本嵌入任務,在多個基準測試中表現出色。
文本嵌入 英語
G
thenlper
1.5M
278
Gte Base En V1.5
Apache-2.0
GTE-base-en-v1.5 是一個英文句子轉換器模型,專注於句子相似度任務,在多個文本嵌入基準測試中表現優異。
文本嵌入
Transformers 支持多種語言

G
Alibaba-NLP
1.5M
63
Gte Multilingual Base
Apache-2.0
GTE Multilingual Base 是一個多語言的句子嵌入模型,支持超過50種語言,適用於句子相似度計算等任務。
文本嵌入
Transformers 支持多種語言

G
Alibaba-NLP
1.2M
246
Polybert
polyBERT是一個化學語言模型,旨在實現完全由機器驅動的超快聚合物信息學。它將PSMILES字符串映射為600維密集指紋,以數值形式表示聚合物化學結構。
文本嵌入
Transformers

P
kuelumbus
1.0M
5
Bert Base Turkish Cased Mean Nli Stsb Tr
Apache-2.0
基於土耳其語BERT的句子嵌入模型,專為語義相似度任務優化
文本嵌入
Transformers 其他

B
emrecan
1.0M
40
GIST Small Embedding V0
MIT
基於BAAI/bge-small-en-v1.5模型微調的文本嵌入模型,通過MEDI數據集與MTEB分類任務數據集訓練,優化了檢索任務的查詢編碼能力。
文本嵌入
Safetensors 英語
G
avsolatorio
945.68k
29
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98