Unieval Dialog
UniEvalは自然言語生成タスクのための多次元評価フレームワークであり、unieval-dialogは対話応答生成タスク向けの事前学習評価器です。
ダウンロード数 2,021
リリース時間 : 10/11/2022
モデル概要
UniEval Dialogは、自然さ、一貫性、魅力など、対話応答生成の品質を複数の次元から評価するための事前学習済み評価器です。
モデル特徴
多次元評価
自然さ、一貫性、魅力、事実根拠性、理解可能性の5つの次元から対話応答を総合的に評価できます。
統一評価フレームワーク
従来の類似性指標(ROUGE、BLEUなど)が先進的な生成モデルを評価する際の限界を克服する統一評価フレームワークを提供します。
細粒度評価
生成モデル間の微妙な差異を捉え、より包括的で細かい評価結果を提供できます。
モデル能力
対話応答品質評価
多次元スコアリング
自動評価
使用事例
自然言語生成評価
対話システム評価
対話システムが生成する応答の品質を評価し、システム性能の改善を支援します。
5つの次元のスコアを提供し、システムの弱点を特定するのに役立ちます。
研究比較
異なる対話生成モデルの性能差を比較するために使用されます。
細かい評価結果を提供し、モデル間の詳細な比較をサポートします。
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98