🚀 BERTIS模型介绍
BERTIS(基于BERT的图像图式模型)是一个用于将输入文本分类到特定图像图式类别的计算模型。图像图式是认知模式,在塑造人类对语言中各种概念的概念化和推理方式方面起着基础性作用。本README将为你介绍BERTIS的用途、训练和评估等相关信息。
🚀 快速开始
如果你觉得这项工作有帮助,请考虑引用我们的论文:
@article{fares2023META4,
title={META4: Semantically-Aligned Generation of metaphoric gestures using self-supervised text and speech representations},
author={Fares, Mireille and Pelachaud, Catherine and Obin, Nicolas},
journal={arXiv preprint arXiv:2311.05481},
year={2023}
}
✨ 主要特性
BERTIS模型描述
BERTIS(基于BERT的图像图式)是一个计算模型,旨在将输入文本分类到特定的图像图式类别中。图像图式是认知模式,在塑造人类对语言中各种概念的概念化和推理方式方面起着基础性作用。BERTIS基于BERT架构构建,并使用Wachowiak等人(2022)创建的专门语料库进行微调。
BERTIS图像图式类别
BERTIS的主要目的是自动将输入文本分类到预定义的图像图式类别中。BERTIS考虑了14种不同的图像图式类别,每种类别都捕捉了一种特定的认知模式。这些类别及其相应的示例(取自Wachowiak等人(2022))如下:
- 中心 - 外围:She brushed the thought away.
- 接触:That blew me away.
- 包含:Keep it in the back of your mind.
- 覆盖:His judgement is clouded.
- 力:They are attracted to each other.
- 链接:Breaking social ties.
- 物体:Seize the opportunity.
- 部分 - 整体:They assembled a theory.
- 规模:This class is bigger than that one.
- 源 - 路径 - 目标:The time for action has arrived.
- 分裂:What separates the men from the boys?
- 物质:Emotions are tinged with suffuse.
- 垂直性:No known spoken language uses the lateral axis for time.
- 支撑:The poor in our country need a boost up.
📦 安装指南
文档未提供安装步骤,故跳过此章节。
💻 使用示例
文档未提供代码示例,故跳过此章节。
📚 详细文档
用途
文档未详细说明模型的用途相关具体内容,故跳过此部分详细介绍。
训练和测试细节
用于训练、验证和测试BERTIS的数据可在以下链接找到:数据链接。其中,80%的数据用于训练BERTIS,10%用于验证,10%用于测试。
评估
指标
- 精确率(Precision):衡量在所有被预测为正例的实例中,正确预测为正例的比例,侧重于正预测的准确性。
- 召回率(Recall):衡量在所有实际正例中,正确预测为正例的比例,侧重于捕捉正例的能力。
- F1分数(F1-score):精确率和召回率的调和平均值,提供了一种平衡的度量,结合了这两个指标。
结果
类别 |
精确率 |
召回率 |
F1分数 |
"CENTER - PERIPHERY" |
0.98 |
0.94 |
0.96 |
"CONTACT" |
1 |
1 |
1 |
"CONTAINMENT" |
0.74 |
0.67 |
0.7 |
"COVERING" |
1 |
1 |
1 |
"FORCE" |
0.8 |
0.91 |
0.85 |
"LINK" |
1 |
1 |
1 |
"OBJECT" |
0.81 |
0.83 |
0.82 |
"PART - WHOLE" |
1 |
1 |
1 |
"SCALE" |
1 |
1 |
1 |
"SOURCE_PATH_GOAL" |
0.81 |
0.74 |
0.77 |
"SPLITTING" |
1 |
1 |
1 |
"SUBSTANCE" |
1 |
1 |
1 |
"SUPPORT" |
1 |
1 |
1 |
"VERTICALITY" |
0.88 |
0.93 |
0.90 |
整体准确率:0.93
对于所有图像图式类别,F1分数在0.77到1之间,这表明BERTIS在准确预测正确的图像图式类别(精确率)和尽可能捕捉正确的图像图式类别(召回率)方面表现良好。我们观察到所有类别的精确率都很高(在0.74到1之间),这表明正确预测的图像图式类别的数量。大多数类别的召回率分数高于0.74,有一个图像图式类别的召回率分数等于0.67。BERTIS在所有图像图式类别上的整体准确率等于0.93,这表明在将输入文本分类到正确的图像图式类别方面具有较高的准确性和良好的性能。
🔧 技术细节
文档未提供详细技术实现细节,故跳过此章节。
📄 许可证
本模型使用的许可证为学术自由许可证(Academic Free License)。
模型相关信息
属性 |
详情 |
开发者 |
Mireille Fares |
语言(NLP) |
英语,可泛化到其他语言,如德语 |
许可证 |
学术自由许可证 |
微调模型 |
BERT Base Cased模型 |