開源UniEval-dialog預訓練評估器 - 助力對話響應生成任務精準評估

首頁

Unieval Dialog

由MingZhong開發

UniEval是針對自然語言生成任務的多維度評估框架，unieval-dialog是其針對對話響應生成任務的預訓練評估器。

對話系統

Transformers

#多維度評估 #對話響應質量 #預訓練評估器

下載量 2,021

發布時間 : 10/11/2022

模型概述

UniEval Dialog是一個預訓練的評估器，用於從多個維度評估對話響應生成的質量，包括自然度、連貫性、吸引力等。

模型特點

多維度評估

能夠從自然度、連貫性、吸引力、事實依據性和可理解性五個維度對對話響應進行綜合評價。

統一評估框架

提供統一的評估框架，克服傳統相似性指標（如ROUGE、BLEU）在評估先進生成模型時的侷限性。

細粒度評估

能夠捕捉生成模型之間的細微差異，提供更全面、更細粒度的評估結果。

模型能力

對話響應質量評估

多維度評分

自動評估

使用案例

自然語言生成評估

對話系統評估

評估對話系統生成的響應質量，幫助改進系統性能。

提供五個維度的評分，幫助識別系統弱點。

研究對比

用於對比不同對話生成模型的性能差異。

提供細粒度的評估結果，支持模型間的詳細對比。

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Unieval Dialog

模型概述

模型特點

模型能力

使用案例

🚀 預訓練評估器 - 用於文本生成的統一多維度評估

🚀 快速開始

✨ 主要特性

多維度評估範式

提出UniEval

預訓練評估器unieval - dialog

📚 詳細文檔