🚀 臨床心理学論文の結果予測モデル
このプロジェクトは、臨床心理学や心理療法の科学論文の要約における肯定的および否定的な結果を予測するためのSciBERTテキスト分類モデルを提供します。このモデルにより、論文の結果の傾向を効率的に分析することができます。
🚀 クイックスタート
このモデルを使用することで、臨床心理学や心理療法の論文要約の結果を予測できます。以下に、いくつかの具体的な使用例を示します。
例1: 多遺伝子リスクスコア(PRS)
多遺伝子リスクスコア(PRS)は、複数の遺伝子座からの遺伝情報に基づいて、特定の病気に対する個人のリスクを記述します。以前の研究では、PRSが広場恐怖症患者の生理学的活性の違いを予測できる可能性が示唆されています。この研究では、暴露試験の種類によって、PRSが患者の心拍数を予測する可能性が異なるかどうかを調べました。我々は、PRSが実環境および仮想環境の両方の試験で心拍数を予測できると仮定しました。広場恐怖症と診断された132人の患者からのデータを分析しました。これらの患者は、実環境(N = 63)または仮想環境(N = 69)の暴露試験を受けました。予想通り、両方の試験でPRSが心拍数を有意に予測しました。この研究の結果は、PRSが広場恐怖症の個人のリスクに関する有用な診断情報を提供するだけでなく、生理学的反応を予測する際の有用性が異なる暴露設定でも安定していることを示唆しています。
例2: 社会経済的地位(SES)
社会経済的適応リハビリテーション理論(SAToR)によると、社会経済的地位(SES)が高い個人は、低い個人よりも精神科リハビリテーションから多くの恩恵を受ける傾向があります。SAToRに沿って、我々は、統合失調症患者において、SESが高いほど症状の重症度の低下が大きいと仮説を立てました。我々は、12か月間のリハビリテーションプログラムを通じて、精神科リハビリテーションクリニックに新たに入院した146人の統合失調症患者を対象に観察研究を行いました。症状の重症度の変化率を予測するために、縦断的な多レベルモデルを計算しました。症状の変化の平均率は、ベースラインから6か月後のフォローアップまでで0.6SDでした。我々の仮説とは反対に、症状の変化はSESによって有意に予測されませんでした。この発見は、SAToRとは反対に、社会経済的地位(SES)が高い個人は、低い個人よりも統合失調症のリハビリテーションから多くの恩恵を受けない可能性があることを示唆しています。
例3: 防御反応性
反社会的人格障害(ASPD)と診断された個人における防御反応性(驚愕瞬目反射によって指標化される)の欠損に関する証拠が増えています。しかし、これまでのところ、ASPD患者の生活の質(QoL)における防御反応性の役割を調べた研究はありません。現在の研究では、143人のASPDと診断された個人において、驚愕瞬目反射がQoLと負の関連があるかどうかを調べました。防御反応性は、恐怖増強驚愕反射テストを使用して測定されました。QoLを評価するために、参加者はShort Form(36)Health Survey(SF - 36)を完了しました。嫌悪画像の視聴中の驚愕瞬目反射の増強欠損は、サンプルの62.3%に見られました。瞬目反射の増強は、QoLと負の関連があり、有意でした。要するに、これらの発見は、防御反応性の欠損がASPD患者の低いQoLに関連しているという明確な証拠を提供しています。
例4: 実験操作の確認1: 成功した操作確認と否定的な結果
実験操作は成功しましたが、SMR - BCIのパフォーマンスには影響がありませんでした。
例5: 実験操作の確認2: 不成功な操作確認と肯定的な結果
実験操作は不成功でしたが、SMR - BCIのパフォーマンスには影響がありました。
✨ 主な機能
- 臨床心理学や心理療法の科学論文要約の結果を予測する。
- 多様なモデルを使用して精度を比較する。
- 異なるデータセットでのモデルのパフォーマンスを可視化する。
📦 インストール
このモデルを使用するには、必要なライブラリをインストールする必要があります。以下のコードを使用して、必要なライブラリをインストールできます。
from transformers import AutoTokenizer, Trainer, AutoModelForSequenceClassification
## 1. トークナイザーをロード
tokenizer = AutoTokenizer.from_pretrained('allenai/scibert_scivocab_uncased')
## 2. 前処理関数をデータに適用
def preprocess_function(examples):
return tokenizer(examples["text"],
truncation=True,
max_length=512,
padding='max_length'
)
tokenized_data = dataset.map(preprocess_function, batched=True)
# 3. モデルをロード
NegativeResultDetector = AutoModelForSequenceClassification.from_pretrained("ClinicalMetaScience/NegativeResultDetector")
## 4. モデルとトークナイザーでトレーナーを初期化
trainer = Trainer(
model=NegativeResultDetector,
tokenizer=tokenizer,
)
# 5. 推論データに対してNegativeResultDetectorを適用して予測
predict_test=trainer.predict(tokenized_data["inference"])
💻 使用例
基本的な使用法
このモデルは、Huggingface上で使用することができます。右側のウィンドウにある「Hosted inference API」を利用します。例の要約または自分で挿入した要約のクラスラベルを予測するには、「Compute」をクリックします。クラスラベル「positive」は「positive results only」に対応し、「negative」は「mixed or negative results」を表します。
高度な使用法
大量のデータを分析する場合には、上記のコードを使用してモデルを適用できます。独自のデータまたは例のデータを分析するための詳細な情報は、このスクリプト から見ることができます。
📚 ドキュメント
モデル
このモデルは、臨床心理学や心理療法の科学論文要約における肯定的および否定的な結果を予測するためのSciBERTテキスト分類モデルです。対応する論文 "Classifying Positive Results in Clinical Psychology Using Natural Language Processing" は、Louis Schiekiera、Jonathan Diederichs & Helen Niemeyerによって、Natural Language Processing in Psychology の特集号 ZfP に掲載されています。
データ
我々は、1,900以上の臨床心理学の要約を「positive results only」と「mixed or negative results」の2つのカテゴリにアノテーションし、SciBERTを使用してモデルを訓練しました。SciBERTモデルは、1つのドメイン内(臨床心理学)および2つのドメイン外のデータセット(心理療法)に対して検証されました。論文 "Classifying Positive Results in Clinical Psychology Using Natural Language Processing" のドキュメント、コード、およびデータに関する詳細な情報は、このGitHubリポジトリ で見ることができます。
結果
表1: モデル評価の指標
モデル |
正解率 |
混合および否定的結果(F1) |
混合および否定的結果(再現率) |
混合および否定的結果(適合率) |
肯定的結果のみ(F1) |
肯定的結果のみ(再現率) |
肯定的結果のみ(適合率) |
SciBERT |
0.864 |
0.867 |
0.907 |
0.830 |
0.860 |
0.822 |
0.902 |
Random Forest |
0.803 |
0.810 |
0.856 |
0.769 |
0.796 |
0.752 |
0.844 |
抽出された p 値 |
0.515 |
0.495 |
0.485 |
0.505 |
0.534 |
0.545 |
0.524 |
抽出された自然言語指標 |
0.530 |
0.497 |
0.474 |
0.523 |
0.559 |
0.584 |
0.536 |
単語数 |
0.475 |
0.441 |
0.423 |
0.461 |
0.505 |
0.525 |
0.486 |
図1: ドメイン内およびドメイン外のデータにおけるモデルのパフォーマンス比較

🔧 技術詳細
このモデルは、SciBERTをベースにしたテキスト分類モデルです。SciBERTは、科学文献に特化した事前学習済みモデルであり、臨床心理学や心理療法の要約の分析に適しています。モデルの訓練には、大量のアノテーションされた要約データが使用され、ドメイン内およびドメイン外のデータセットでの検証が行われました。
📄 ライセンス
このツールはMITライセンスの下で提供されています。
注意事項
このツールは、SciBERTモデルに基づいて、科学論文の要約における肯定的および否定的な結果の普及を分析および予測するために開発されました。出版バイアスは、科学文献で観察される特定の結果のパターンの説明としてもっともらしいものですが、このツールによって行われる分析は、出版バイアスまたは他の根本的な要因の存在を決定的に証明するものではありません。このツールはデータを評価するだけで、観察された傾向の根本的な理由を深く掘り下げるものではないことを理解することが重要です。
このツールの検証は、臨床心理学および心理療法の分野の一次研究に対して行われました。他の分野の要約や他のタイプの研究(メタアナリシスなど)に適用した場合に洞察を得る可能性がありますが、そのような文脈での適用性と精度はまだ十分にテストされていません。このツールの開発者は、ツールの結果の誤解や誤用に対して責任を負いません。また、統計分析や予測モデルに内在する限界を十分に理解することをユーザーに促します。
資金提供とプロジェクト
この研究は、フライエ大学ベルリンにおける PANNE Project (ドイツ語の略称で、「学問分野比較における結果の非公開および非受容の出版バイアス分析」)の一環として行われ、ベルリン大学連合によって資金提供されました。著者はベルリン大学連合のメンバーです。