B

Bleurt Large 128

由 Elron 开发
BLEURT是一个用于评估文本生成质量的指标模型,基于预训练的BERT架构,能够自动评估生成文本与参考文本的相似度。
下载量 58
发布时间 : 3/2/2022

模型简介

BLEURT是谷歌研究院开发的文本生成评估指标模型,通过学习参考文本和候选文本之间的相似度来评估生成质量。该PyTorch版本是原始BLEURT模型的转换实现。

模型特点

稳健的评估指标
通过学习大量人工评分数据,能够提供与人类判断高度一致的自动评估结果
基于BERT架构
利用预训练的BERT模型捕捉文本深层语义特征
端到端训练
整个模型(包括预训练和微调阶段)针对评估任务进行了端到端优化

模型能力

自动文本质量评估
生成文本与参考文本相似度评分
多候选文本比较

使用案例

自然语言处理研究
机器翻译评估
评估不同机器翻译系统生成的译文质量
提供与人工评估高度相关的自动评分
文本摘要评估
比较不同摘要系统生成的摘要与参考摘要的相似度
可替代部分人工评估工作
模型开发
生成模型调优
作为损失函数或评估指标用于训练生成模型
帮助改进生成模型输出质量
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase