Dense Encoder Distilbert Frozen Emb
D
Dense Encoder Distilbert Frozen Emb
由vocab-transformers開發
基於DistilBERT架構的密集檢索模型,在MS MARCO數據集上訓練,詞嵌入層保持凍結狀態
下載量 26
發布時間 : 4/5/2022
模型概述
該模型是DistilBERT的變體,專門針對信息檢索任務優化,採用MarginMSE損失函數訓練,適用於文檔和查詢的密集向量表示生成
模型特點
凍結詞嵌入訓練
訓練過程中保持預訓練的詞嵌入層參數不變,可能提高模型穩定性
MarginMSE優化
採用MarginMSE損失函數進行訓練,專門優化檢索任務的排序性能
輕量級架構
基於DistilBERT架構,比原始BERT模型更小更快,同時保持較好性能
模型能力
文本向量表示
語義相似度計算
信息檢索
文檔排序
使用案例
搜索引擎
網頁搜索結果排序
為搜索引擎生成查詢和文檔的密集向量表示,用於相關性排序
在TREC-DL等標準檢索評測中表現良好
問答系統
答案段落檢索
從大量文檔中快速檢索與問題相關的段落
在FiQA等金融問答數據集上表現穩定
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98