Sbertdistil
基於sentence-transformers的輕量級模型,用於將句子和段落映射到384維向量空間,支持聚類和語義搜索等任務。
下載量 114
發布時間 : 1/8/2024
模型概述
這是一個輕量級的快速模型,專門用於解決句子相似度判定問題,未來還會進行進一步的加速和輕量化。
模型特點
輕量快速
模型經過優化,適合需要快速處理句子相似度的場景
多階段訓練
模型經過兩階段訓練:先在維基百科數據上預訓練,再在對話數據上微調
384維向量空間
能將句子和段落映射到384維的密集向量空間
模型能力
句子嵌入
語義相似度計算
文本聚類
語義搜索
使用案例
信息檢索
跨語言語義搜索
即使查詢語言與文檔語言不同,也能找到語義相似的結果
示例顯示俄語查詢與英語文檔的相似度為0.807
文本分析
文檔聚類
將語義相似的文檔自動分組
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98