Bge Micro V2
B
Bge Micro V2
由SmartComponents開發
bge_micro 是一個基於 sentence-transformers 的句子嵌入模型,專注於句子相似度計算和特徵提取任務。
下載量 468
發布時間 : 2/15/2024
模型概述
該模型主要用於生成句子的嵌入表示,以便進行句子相似度計算、文本分類和信息檢索等任務。
模型特點
高效的句子嵌入
能夠快速生成高質量的句子嵌入表示,適用於大規模文本處理。
多任務支持
支持句子相似度計算、特徵提取、文本分類等多種自然語言處理任務。
在 MTEB 基準測試中表現良好
在多個 MTEB 基準測試任務中取得了不錯的成績,展示了其強大的泛化能力。
模型能力
句子相似度計算
特徵提取
文本分類
信息檢索
聚類分析
使用案例
文本分類
亞馬遜評論分類
用於對亞馬遜商品評論進行情感分類或主題分類。
在 MTEB AmazonPolarityClassification 任務中達到 79.75% 的準確率。
銀行客服問題分類
用於對銀行客服系統中的用戶問題進行自動分類。
在 MTEB Banking77Classification 任務中達到 81.17% 的準確率。
信息檢索
問答系統檢索
用於從知識庫中檢索與用戶問題最相關的答案。
在 MTEB CQADupstackAndroidRetrieval 任務中 map@100 達到 39.47。
句子相似度
重複問題檢測
用於識別論壇或問答平臺中的重複問題。
在 MTEB AskUbuntuDupQuestions 任務中 mrr 達到 71.94。
生物醫學文本相似度
用於計算生物醫學文本之間的語義相似度。
在 MTEB BIOSSES 任務中 cos_sim_pearson 達到 84.16。
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98