🚀 トランスフォーマーモデル
このモデルは、心理療法の文脈における治療者の発言のトピック分類のために微調整されたBert-base-uncasedモデルです。多クラス分類タスクを行い、様々なトピックラベルを持っています。
🚀 クイックスタート
このモデルは、心理療法のコンテキストにおける治療者の発言のトピック分類に使用されます。多クラス分類タスクで、以下のラベルがあります。
id2label = {0: '時間切れと将来の面談',
1: '彼への複雑な感情',
2: '欲望と失望',
3: '個人の成長と意思決定',
4: '自己受容と関係',
5: '恐怖の理解と対峙',
6: '会話の理解',
7: '意味と意図の明確化',
8: '逃避と離脱の欲求',
9: '不確実性と問題の理解',
10: 'オープンな会話と共有',
11: '感情的な傷と苦みの探求',
12: '罪悪感と自己非難のダイナミクス',
13: '有意義な関係のダイナミクス',
14: '学習における苦労と欲望',
15: '性別役割と関係',
16: '個人の変化との苦闘',
17: '複雑な母親 - 兄弟関係',
18: '声と音の知覚',
19: '困難と感情的な負担',
20: '老化に対する恐怖と反省',
21: '泣きと涙の感情',
22: '父子関係と権威',
23: '可能性と潜在的な結果',
24: '内なる苦闘と無力感',
25: '有意義な個人目標の追求',
26: '仕事の不安と自己反省',
27: '結婚の不安と依存',
28: '怒りと不満の表現',
29: '内なる子供の育成',
30: '心理療法と父親との関係',
31: '幸福と喜びの表現',
32: '過去の振り返り',
33: '飲酒習慣と懸念',
34: 'エネルギーレベルの管理と向上',
35: 'うつ病とその根源の理解',
36: '神経系とストレス反応'}
💻 使用例
基本的な使用法
from transformers import AutoTokenizer, AutoModelForSequenceClassification
tokenizer = AutoTokenizer.from_pretrained("AIPsy/bert-base-therapist-topic-classification-eng")
model = AutoModelForSequenceClassification.from_pretrained("AIPsy/bert-base-therapist-topic-classification-eng")
text = "You know, I mean, it seems like you could just go to work and feel so much better."
encoding = tokenizer(
text,
truncation=True,
padding="max_length",
return_tensors="pt"
)
output = model(encoding['input_ids'], encoding['attention_mask']).logits
result = np.argmax(output.detach().numpy(), axis=-1)
print(id2label[result[0]])
'仕事の不安と自己反省'
📚 ドキュメント
データセット
ソースデータは、YouTubeに公開されている心理療法セッションの録音です。話者の分離と文字起こしを行った後、15324個の項目(文)が得られました。
推奨事項
心理療法セッションで議論される問題の幅広いコンテキストを考慮すると、このモデルは一般的な人間のコミュニケーションの分析にも使用できると考えられます。
評価指標
学習済みモデルのスコア指標
サンプル |
F1マクロ |
テスト |
0.74 |
検証 |
0.77 |
学習 |
0.97 |
テストサンプルのカテゴリ別F1スコア指標
ID |
トピック |
適合率 |
再現率 |
F1 |
0 |
時間切れと将来の面談 |
0.81 |
0.80 |
0.80 |
1 |
彼への複雑な感情 |
0.86 |
0.88 |
0.87 |
2 |
欲望と失望 |
0.71 |
0.73 |
0.72 |
3 |
個人の成長と意思決定 |
0.64 |
0.77 |
0.70 |
4 |
自己受容と関係 |
0.69 |
0.82 |
0.75 |
5 |
恐怖の理解と対峙 |
0.93 |
0.76 |
0.84 |
6 |
会話の理解 |
0.77 |
0.85 |
0.81 |
7 |
意味と意図の明確化 |
0.81 |
0.76 |
0.79 |
8 |
逃避と離脱の欲求 |
0.68 |
0.60 |
0.64 |
9 |
不確実性と問題の理解 |
0.81 |
0.81 |
0.81 |
10 |
オープンな会話と共有 |
0.79 |
0.77 |
0.78 |
11 |
感情的な傷と苦みの探求 |
0.74 |
0.70 |
0.72 |
12 |
罪悪感と自己非難のダイナミクス |
0.80 |
0.69 |
0.74 |
13 |
有意義な関係のダイナミクス |
0.75 |
0.75 |
0.75 |
14 |
学習における苦労と欲望 |
0.82 |
0.72 |
0.77 |
15 |
性別役割と関係 |
0.83 |
0.83 |
0.83 |
16 |
個人の変化との苦闘 |
0.76 |
0.60 |
0.67 |
17 |
複雑な母親 - 兄弟関係 |
0.60 |
0.74 |
0.67 |
18 |
声と音の知覚 |
0.74 |
0.78 |
0.76 |
19 |
困難と感情的な負担 |
0.75 |
0.67 |
0.71 |
20 |
老化に対する恐怖と反省 |
0.62 |
0.64 |
0.63 |
21 |
泣きと涙の感情 |
0.65 |
0.76 |
0.70 |
22 |
父子関係と権威 |
0.93 |
0.80 |
0.86 |
23 |
可能性と潜在的な結果 |
0.72 |
0.64 |
0.68 |
24 |
内なる苦闘と無力感 |
0.68 |
0.71 |
0.69 |
25 |
有意義な個人目標の追求 |
0.58 |
0.65 |
0.61 |
26 |
仕事の不安と自己反省 |
0.70 |
0.73 |
0.71 |
27 |
結婚の不安と依存 |
0.82 |
0.82 |
0.82 |
28 |
怒りと不満の表現 |
0.73 |
0.76 |
0.75 |
29 |
内なる子供の育成 |
0.74 |
0.70 |
0.72 |
30 |
心理療法と父親との関係 |
0.80 |
0.82 |
0.81 |
31 |
幸福と喜びの表現 |
0.78 |
0.79 |
0.78 |
32 |
過去の振り返り |
0.78 |
0.60 |
0.68 |
33 |
飲酒習慣と懸念 |
0.69 |
0.79 |
0.73 |
34 |
エネルギーレベルの管理と向上 |
0.54 |
0.62 |
0.58 |
35 |
うつ病とその根源の理解 |
0.65 |
0.85 |
0.73 |
36 |
神経系とストレス反応 |
0.61 |
0.67 |
0.64 |
引用
- 論文: Vanin, A., Bolshev, V., & Panfilova, A. (2024). Applying LLM and Topic Modelling in Psychotherapeutic Contexts. ArXiv, abs/2412.17449. https://arxiv.org/abs/2412.17449
- 開発者: @myentity, @VadZhen, @Alek123
- ライセンス: MIT
BibTeX:
@misc{vanin2024applyingllmtopicmodelling,
title={Applying LLM and Topic Modelling in Psychotherapeutic Contexts},
author={Alexander Vanin and Vadim Bolshev and Anastasia Panfilova},
year={2024},
eprint={2412.17449},
archivePrefix={arXiv},
primaryClass={cs.LG},
url={https://arxiv.org/abs/2412.17449},
}
📄 ライセンス
このプロジェクトはMITライセンスの下で公開されています。