Bleurt Large 128
B
Bleurt Large 128
由 Elron 开发
BLEURT是一个用于评估文本生成质量的指标模型,基于预训练的BERT架构,能够自动评估生成文本与参考文本的相似度。
下载量 58
发布时间 : 3/2/2022
模型简介
BLEURT是谷歌研究院开发的文本生成评估指标模型,通过学习参考文本和候选文本之间的相似度来评估生成质量。该PyTorch版本是原始BLEURT模型的转换实现。
模型特点
稳健的评估指标
通过学习大量人工评分数据,能够提供与人类判断高度一致的自动评估结果
基于BERT架构
利用预训练的BERT模型捕捉文本深层语义特征
端到端训练
整个模型(包括预训练和微调阶段)针对评估任务进行了端到端优化
模型能力
自动文本质量评估
生成文本与参考文本相似度评分
多候选文本比较
使用案例
自然语言处理研究
机器翻译评估
评估不同机器翻译系统生成的译文质量
提供与人工评估高度相关的自动评分
文本摘要评估
比较不同摘要系统生成的摘要与参考摘要的相似度
可替代部分人工评估工作
模型开发
生成模型调优
作为损失函数或评估指标用于训练生成模型
帮助改进生成模型输出质量
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers 支持多种语言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers 英语

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统 中文
R
uer
2,694
98