Quora Distilroberta Base
基於Quora重複問題數據集訓練的交叉編碼器模型,用於預測兩個問題是否為重複問題的概率
下載量 28.01k
發布時間 : 3/2/2022
模型概述
該模型使用SentenceTransformers的交叉編碼器架構,專門用於檢測Quora平臺上的重複問題。它能夠預測兩個給定問題屬於重複問題的概率,輸出0到1之間的分數。
模型特點
精確的重複問題檢測
專門針對Quora平臺的問題對進行優化,能準確識別語義重複的問題
概率輸出
輸出0-1之間的概率分數,便於設置不同閾值適應不同場景需求
高效架構
基於distilroberta-base的輕量級模型,在保持性能的同時提高推理效率
模型能力
文本相似度評估
重複問題檢測
語義匹配
使用案例
問答平臺
Quora重複問題檢測
自動識別平臺上重複或高度相似的問題
減少重複內容,提升平臺內容質量
內容管理
FAQ系統優化
合併相似用戶問題,精簡FAQ條目
提高FAQ系統效率和用戶體驗
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98