flan-t5-tsa-thor-xlオープンソースモデル - 英語テキストの目標感情を的確に分析

ホーム

Flan T5 Tsa Thor Xl

nicolay-rによって開発

Flan-T5-XLをファインチューニングしたターゲット感情分析モデルで、3段階推論のチェーン・オブ・シンキング(THoR)フレームワークで訓練され、英語テキスト専用に設計されています

大規模言語モデル

Transformers

英語オープンソースライセンス:MIT #ターゲット感情分析 #チェーン・オブ・シンキング推論 #マルチホップ推論

ダウンロード数 34

リリース時間 : 6/2/2024

モデル概要

このモデルはターゲット感情分析タスクに使用され、特定のエンティティに対する文の感情極性（ポジティブ/ネガティブ/ニュートラル）を予測できます

モデル特徴

3段階推論チェーン・オブ・シンキング

THoRフレームワークを使用して訓練され、多段階推論により感情分析の精度を向上させます

ターゲット感情分析

文中の特定エンティティに対する感情傾向を正確に分析できます

バッチ処理サポート

2025年更新後にバッチモード処理をサポート予定

モデル能力

テキスト感情分析

ターゲットエンティティ感情認識

多段階推論

使用事例

感情分析

ソーシャルメディア感情モニタリング

ソーシャルメディアコンテンツ中の特定人物/ブランドに対する感情傾向を分析

RuSentNE-2023テストセットでF1_PNが60.024を達成

製品レビュー分析

レビュー中の特定製品特徴に対する感情極性を識別

🚀 モデルIDのモデルカード

このモデルは、ターゲット感情分析（TSA）タスクにおけるChain-of-Thought tuned verson Flan-T5を表しており、RuSentNE-2023コレクションのトレーニングデータを使用しています。このモデルは、英語で書かれたテキストを対象として設計されています。元のコレクションは非英語のテキストで構成されていたため、内容は**[googletrans]を使用して自動的に英語に翻訳**されています。

与えられた入力文とその中で言及されたエンティティ（ターゲット）に対して、このモデルは以下のクラスのいずれかを回答することで、作者の感情状態を予測します。 [positive, negaitive, neutral]

モデルの詳細

2025年2月23日更新: 🔥 バッチモードサポート。 Flan-T5プロバイダを参照してください。 bulk-chainプロジェクトのためのものです。テストはこちらで利用可能

モデルの説明

開発者: nicolay-rによって再構築され、実装に関する当初の功績はscofield7419にあります。
モデルタイプ: Flan-T5
言語 (NLP): 英語
ライセンス: Apache License 2.0

モデルのソース

リポジトリ: Reasoning-for-Sentiment-Analysis-Framework
論文: https://arxiv.org/abs/2404.12342
デモ: 関連モデルを起動するためのGoogle-Colab上のコードがあります

🚀 クイックスタート

直接利用

この一連のスクリプトは、推論のための純粋なtorchとtransformersベースのモデルの使用方法を表しています。

この例は、GoogleColab上でも利用可能です。

以下は、モデルのアプリケーションを素早く開始するための3つの手順です。

モデルとトークナイザーの読み込み

import torch
from transformers import AutoTokenizer, T5ForConditionalGeneration

# モデルのパスを設定します。
model_path = "nicolay-r/flan-t5-tsa-thor-xl"
# デバイスを設定します。
device = "cuda:0"

model = T5ForConditionalGeneration.from_pretrained(model_path, torch_dtype=torch.bfloat16)
tokenizer = AutoTokenizer.from_pretrained(model_path)
model.to(device)

LLMの応答を生成するための質問メソッドの設定

def ask(prompt):
  inputs = tokenizer(prompt, return_tensors="pt", add_special_tokens=False)
  inputs.to(device)
  output = model.generate(**inputs, temperature=1)
  return tokenizer.batch_decode(output, skip_special_tokens=True)[0]

思考連鎖の設定

def target_sentiment_extraction(sentence, target):
  # ラベルを設定します。
  labels_list = ['neutral', 'positive', 'negative']
  # 思考連鎖を設定します。
  step1 = f"Given the sentence {sentence}, which specific aspect of {target} is possibly mentioned?"
  aspect = ask(step1)
  step2 = f"{step1}. The mentioned aspect is about {aspect}. Based on the common sense, what is the implicit opinion towards the mentioned aspect of {target}, and why?"
  opinion = ask(step2)
  step3 = f"{step2}. The opinion towards the mentioned aspect of {target} is {opinion}. Based on such opinion, what is the sentiment polarity towards {target}?"
  emotion_state = ask(step3)
  step4 = f"{step3}. The sentiment polarity is {emotion_state}. Based on these contexts, summarize and return the sentiment polarity only, " + "such as: {}.".format(", ".join(labels_list))
  # 最終的な応答を返します。
  return ask(step4)

最後に、以下のようにモデルの結果を推論することができます。

# 入力文。
sentence = "Over the past 28 years, the leader has been working hard to achieve the release of Peltier and is a member of the Leonard Peltier Defense Committee."
# 入力ターゲット。
target = "Peltier"
# 出力応答
flant5_response = target_sentiment_extraction(sentence, target)
print(f"Author opinion towards `{target}` in `{sentence}` is:\n{flant5_response}")

モデルの応答は以下の通りです。

Author opinion towards "Peltier" in "Over ..." is: positive

下流利用

Reasoning-for-Sentiment-Analysisフレームワークの関連セクションを参照してください。

この例では、このモデルをTHoRモードでRuSentNE-2023コンペティションの検証データに適用して評価しています。

python thor_finetune.py -m "nicolay-r/flan-t5-tsa-thor-xl" -r "thor" -d "rusentne2023" -z -bs 4 -f "./config/config.yaml"

実装の再現には、Google Colab Notebookに従ってください。

範囲外の利用

このモデルは、RuSentNE-2023データセットに対して微調整されたFlan-T5のバージョンを表しています。データセットが3段階の出力回答（positive, negative, neutral）を表しているため、一般的な動作はこの特定のタスクに偏っている可能性があります。

推奨事項

ユーザー（直接利用者と下流利用者の両方）は、モデルのリスク、バイアス、および制限について認識しておく必要があります。さらなる推奨事項については、より多くの情報が必要です。

📦 インストール

モデルを使用するには、上記のクイックスタートセクションの手順に従ってください。

📚 ドキュメント

トレーニングデータ

trainデータは、GoogleTransAPIを使用して自動的に英語に翻訳されたものを利用しています。元のテキストはロシア語で書かれており、以下のリポジトリから取得されています。 https://github.com/dialogue-evaluation/RuSentNE-evaluation

英語のデータセットの翻訳版は、以下のスクリプトを介して自動的にダウンロードすることができます。 https://github.com/nicolay-r/Reasoning-for-Sentiment-Analysis-Framework/blob/main/rusentne23_download.py

トレーニング手順

このモデルは、論文https://arxiv.org/abs/2305.11255 で提案されたThree-hop-Reasoningフレームワークを使用してトレーニングされています。トレーニング手順の実行には、このフレームワークの再構築版が使用されています。 https://github.com/nicolay-r/Reasoning-for-Sentiment-Analysis-Framework

再現のためのGoogle-colabノートブック: https://colab.research.google.com/github/nicolay-r/Reasoning-for-Sentiment-Analysis-Framework/blob/main/Reasoning_for_Sentiment_Analysis_Framework.ipynb

設定: Flan-T5-xlを最大64トークン、バッチサイズ4で使用。 GPU: NVidia-A100、bfloat16、約30分/エポック

全体のトレーニングプロセスは3エポックかかりました。

image/png

トレーニングハイパーパラメータ

トレーニング体制: すべての構成詳細は、関連するconfigファイルに記載されています。

評価

テストデータ、要因、およびメトリクス

テストデータ test評価データへの直接リンク: https://github.com/dialogue-evaluation/RuSentNE-evaluation/blob/main/final_data.csv
メトリクス モデルの評価には、2つのメトリクスが使用されています。

F1_PN -- positiveとnegativeクラスに対するF1メジャー
F1_PN0 -- positive, negative, **およびneutral**クラスに対するF1メジャー

結果

このモデルのテスト評価では、F1_PN = 60.024が示されています。

以下は、4エポック後のRuSentNE-2023 testセットでの最終的なパフォーマンスを示すトレーニングプロセスのログです（5-6行目）。

  F1_PN  F1_PN0  default   mode
0  66.678  73.838   73.838  valid
1  68.019  74.816   74.816  valid
2  67.870  74.688   74.688  valid
3  65.090  72.449   72.449   test
4  65.090  72.449   72.449   test

📄 ライセンス

このモデルは、Apache License 2.0の下で提供されています。

属性	详情
モデルタイプ	Flan-T5
トレーニングデータ	`train`データは、GoogleTransAPIを使用して自動的に英語に翻訳されたものを利用しています。