Dpr Question Encoder Single Lfqa Wiki
D
Dpr Question Encoder Single Lfqa Wiki
Developed by vblagoje
基於DPR架構的問題編碼器模型,專為長形式問答(LFQA)任務設計,通過兩階段訓練優化檢索性能
Downloads 588
Release Time : 3/2/2022
Model Overview
該模型利用Transformer的池化輸出作為問題表徵,主要用於從大規模知識庫中檢索與長形式問題相關的答案段落
Model Features
兩階段訓練策略
第一階段使用LFQA數據集微調,第二階段引入維基百科索引構建更優質的訓練樣本
困難負樣本優化
通過精心設計的負樣本選擇策略(餘弦相似度0.55-0.65範圍)提升模型區分能力
跨編碼器增強
第二階段使用SBert交叉編碼器對候選答案進行評分,篩選高質量正負樣本
Model Capabilities
問題向量編碼
語義相似度計算
開放域檢索
長形式問答支持
Use Cases
知識檢索系統
維基百科問答系統
從維基百科中檢索與複雜問題最相關的答案段落
可替代傳統關鍵詞檢索,提供語義更匹配的結果
教育輔助
學習助手
幫助學生檢索詳細解釋複雜概念的長篇答案
提供比簡單問答更全面的知識解釋
Featured Recommended AI Models
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers Supports Multiple Languages

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers English

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 Chinese
R
uer
2,694
98