🚀 BERTISモデルのモデルカード
このREADMEでは、BERTISモデルの概要、目的、使い方について説明します。BERTISは論文 "META4: Semantically-Aligned Generation of metaphoric gestures using self-supervised text and speech representations" で発表されています。
もしこの研究が役に立った場合は、論文を引用することを検討してください。
Bibtex:
@article{fares2023META4,
title={META4: Semantically-Aligned Generation of metaphoric gestures using self-supervised text and speech representations},
author={Fares, Mireille and Pelachaud, Catherine and Obin, Nicolas},
journal={arXiv preprint arXiv:2311.05481},
year={2023}
}
🚀 クイックスタート
このREADMEでは、BERTISモデルについての概要、目的、使い方を説明します。このモデルに関する詳細な情報が提供されています。
✨ 主な機能
- 入力テキストを特定のイメージスキーマクラスに分類する機能を持つ。
- 14種類の異なるイメージスキーマクラスを考慮して分類を行う。
📚 ドキュメント
BERTISモデルの説明
BERTIS(BERT-based Image Schema)は、入力テキストを特定のイメージスキーマクラスに分類するために設計された計算モデルです。イメージスキーマは、人間が言語に含まれる様々な概念を概念化し、推論する方法を形作る上で基本的な役割を果たす認知パターンです。BERTISはBERTアーキテクチャに基づいて構築されており、Wachowiakら(2022)によって作成された特殊なコーパスを使用してファインチューニングされています。
BERTISのイメージスキーマクラス
BERTISの主な目的は、入力テキストを事前定義されたイメージスキーマクラスに自動的に分類することです。BERTISは14種類の異なるイメージスキーマクラスを考慮しており、それぞれが特定の認知パターンを捉えています。これらのクラスとそれに対応する例(Wachowiakら(2022)から引用)は以下の通りです。
- 中心 - 周辺(CENTER - PERIPHERY): She brushed the thought away.
- 接触(CONTACT): That blew me away.
- 包含(CONTAINMENT): Keep it in the back of your mind.
- 覆い(COVERING): His judgement is clouded.
- 力(FORCE): They are attracted to each other.
- 結びつき(LINK): Breaking social ties.
- 物体(OBJECT): Seize the opportunity.
- 部分 - 全体(PART - WHOLE): They assembled a theory.
- 尺度(SCALE): This class is bigger than that one.
- 源 - 経路 - 目標(SOURCE_PATH_GOAL): The time for action has arrived.
- 分割(SPLITTING): What separates the men from the boys?
- 物質(SUBSTANCE): Emotions are tinged with suffuse.
- 垂直性(VERTICALITY): No known spoken language uses the lateral axis for time.
- 支持(SUPPORT): The poor in our country need a boost up.
トレーニングとテストの詳細
BERTISのトレーニング、検証、テストに使用されるデータは、以下のリンクにあります。
https://github.com/lwachowiak/Systematic-Analysis-of-Image-Schemas-through-Explainable-Multilingual-Language-Models/blob/main/Data/Image%20Schemas%20English%20and%20German.csv
データの80%はBERTISのトレーニングに、10%は検証に、10%はテストに使用されました。
評価
指標
- 適合率(Precision): 正と予測されたすべてのインスタンスのうち、正しく予測された正のインスタンスの割合を測定します。正の予測の精度に焦点を当てています。
- 再現率(Recall): すべての実際の正のインスタンスのうち、正しく予測された正のインスタンスの割合を測定します。正のインスタンスを捕捉する能力に焦点を当てています。
- F1スコア: 適合率と再現率の調和平均で、両方の指標を組み合わせたバランスの取れた測定値を提供します。
結果
クラス |
適合率 |
再現率 |
F1スコア |
"CENTER - PERIPHERY" |
0.98 |
0.94 |
0.96 |
"CONTACT" |
1 |
1 |
1 |
"CONTAINMENT" |
0.74 |
0.67 |
0.7 |
"COVERING" |
1 |
1 |
1 |
"FORCE" |
0.8 |
0.91 |
0.85 |
"LINK" |
1 |
1 |
1 |
"OBJECT" |
0.81 |
0.83 |
0.82 |
"PART - WHOLE" |
1 |
1 |
1 |
"SCALE" |
1 |
1 |
1 |
"SOURCE_PATH_GOAL" |
0.81 |
0.74 |
0.77 |
"SPLITTING" |
1 |
1 |
1 |
"SUBSTANCE" |
1 |
1 |
1 |
"SUPPORT" |
1 |
1 |
1 |
"VERTICALITY" |
0.88 |
0.93 |
0.90 |
全体的な正解率 : 0.93
すべてのイメージスキーマクラスについて、F1スコアは0.77から1の間であり、BERTISが正しいイメージスキーマクラスを正確に予測する(適合率)とともに、できるだけ多くの正しいイメージスキーマクラスを捕捉する(再現率)点で良好な性能を示しています。実際、これらの結果はすべてのイメージスキーマクラスの適合率と再現率のスコアにも反映されています。すべてのクラスについて高い適合率(0.74から1の間)が観察されており、これは正しく予測されたイメージスキーマクラスの数を示しています。ほとんどのクラスの再現率は0.74を超えており、1つのイメージスキーマクラスの再現率は0.67です。すべてのイメージスキーマクラスに関するBERTISの全体的な正解率は0.93であり、入力テキストを正しいイメージスキーマクラスに分類する際の高い正確性と良好な性能を示しています。
📄 ライセンス
Academic Free License(AFL - 3.0)
開発者: Mireille Fares
言語(NLP): 英語。ドイツ語などの他の言語にも汎化可能。
ファインチューニング元のモデル: BERT Base Casedモデル