coherence-all-mpnet-base-v2开源模型 - 免费评估对话回答连贯性与相关性

首页

Coherence All Mpnet Base V2

由 enochlev 开发

基于sentence-transformers/all-mpnet-base-v2微调的交叉编码器模型，用于评估对话回答的连贯性和相关性。

对话系统

Transformers

英语#对话连贯性评估 #问答相关性检测 #儿童语言分析

下载量 494

发布时间 : 3/8/2025

模型简介

该模型专门用于评估给定提示或问题下回答的相关性与连贯性，可增强聊天机器人或对话系统的会话质量。

模型特点

对话连贯性评估

能够准确评估回答与问题的连贯性和相关性，输出连贯性分数。

基于CHILDES数据集微调

使用CHILDES对话数据集进行微调，有效捕捉会话连贯性特征。

易于集成

可通过sentence-transformers库轻松集成到现有对话系统中。

模型能力

对话连贯性评分

回答相关性评估

使用案例

对话系统增强

聊天机器人质量提升

用于评估和筛选聊天机器人的回答，确保回答与问题相关且连贯。

提高对话系统的用户体验和自然度

教育应用

评估儿童与教育应用的对话质量，确保回答符合教育目标。

提升教育应用的互动效果

🚀 连贯性测试模型

本模型专为对话连贯性测试而设计，能有效评估回复与问题的相关性和连贯性，可用于提升聊天机器人和对话系统的性能。

🚀 快速开始

你可以按照以下方式使用该模型：

from sentence_transformers import CrossEncoder
model = CrossEncoder('enochlev/coherence-all-mpnet-base-v2')
output = model.predict([["What is your favorite color?", "Blue!"],
                        ["Do you like playing outside?", "I like ice cream."],
                        ["What is your favorite animal?", "I like dogs!"],
                        ["Do you want to go to the park?", "Yes, I want to go on the swings!"],
                        ["What is your favorite food?", "I like playing with blocks."],
                        ["Do you have a pet?", "Yes, I have a cat named Whiskers."],
                        ["What is your favorite thing to do on a sunny day?", "I like playing soccer with my friends."]])

print(output)

输出数组代表连贯性得分，分数越高表示连贯性越强。

✨ 主要特性

专为对话连贯性测试设计：该模型是 sentence-transformers/all-mpnet-base-v2 的微调版本，专门用于评估对话的连贯性。
使用交叉编码器架构：借助 sentence-transformers 库中的交叉编码器架构，能够准确评估回复与问题的相关性。
可直接使用或进一步微调：可以直接用于提升聊天机器人或对话系统的性能，也可以针对特定的对话系统进行进一步微调。

📚 详细文档

模型详情

模型描述

此模型是 sentence-transformers/all-mpnet-base-v2 的微调版本，专为对话连贯性测试而设计。它利用 sentence-transformers 库中的交叉编码器架构，旨在评估给定提示或问题下回复的相关性和连贯性。

开发者：Enoch Levandovsky
模型类型：交叉编码器
语言：英语
许可证：更多信息请查看仓库
微调基础模型：sentence-transformers/all-mpnet-base-v2

模型来源

仓库：Hugging Face 上的模型
空间演示：连贯性测试空间

用途

直接使用

该模型旨在评估给定问题或提示下回复的连贯性。它可以直接用于提升聊天机器人或对话系统的性能，通过预测回复的连贯性或相关性，从而提高对话代理的质量。

下游使用

该模型可以针对特定的对话系统进行进一步微调，或作为更大的对话式人工智能框架的组件，以确保回复有意义且符合上下文。

超出适用范围的使用

该模型不适用于需要复杂情感分析、情感基调识别或对话连贯性评估之外的任务。

结果

示例输出中，接近 1 的分数表示回复具有连贯性或相关性。例如：

Output >>> array([0.88097143, 0.04521223, 0.943173  , 0.9436357 , 0.04369843,
                  0.94450355, 0.8392763 ], dtype=float32)

评估与局限性

测试数据、因素和指标

该模型使用 CHILDES 数据集进行了微调与评估，以确保能有效捕捉对话的连贯性。

建议

用户应注意，虽然该模型能预测连贯性，但可能无法完全捕捉到对话中的细微元素，如讽刺或幽默。

环境影响

请参考机器学习影响计算器来估算碳排放。虽然没有该模型训练的具体细节，但请考虑采用一般的最佳实践来减少环境影响。

引用

若要引用此模型，请在 Hugging Face 仓库页面和原模型创建者 Enoch Levandovsky 处提供适当的引用信息。

📄 许可证

更多许可证信息请查看仓库。

属性	详情
模型类型	交叉编码器
语言	英语
微调基础模型	sentence-transformers/all-mpnet-base-v2

💡 使用建议

该模型虽然能有效评估对话连贯性，但对于包含讽刺、幽默等细微元素的对话，可能无法完全准确评估。在使用时需注意其局限性。

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

智启未来，您的人工智能解决方案智库