Frugalscore Medium Bert Base Mover Score
基於知識蒸餾的輕量級文本評估模型,用小型學生模型模擬大型教師模型的評分行為
下載量 43
發布時間 : 3/2/2022
模型概述
通過固定低成本方式實現BERTScore等昂貴NLG評估指標,保留原始性能90%以上
模型特點
高效知識蒸餾
通過迴歸任務蒸餾教師模型的評分行為,學生模型參數量僅為教師1%
多教師兼容
支持BERT/RoBERTa/DeBERTa等多種教師模型的知識遷移
評估指標保留
在BERTScore和MoverScore指標上保留原始性能90-95%
模型能力
文本生成質量評估
機器翻譯評估
摘要生成評估
對話系統評估
使用案例
NLG系統開發
機器翻譯質量監控
在持續集成中低成本評估翻譯模型輸出質量
相比原始BERTScore提速8-12倍
文本摘要評估
用於摘要生成模型的自動化評估流程
與人工評價相關性達0.85-0.92
學術研究
輕量級評估基準
資源受限環境下替代昂貴評估指標
內存佔用減少80%
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98