🚀 高度な自傷・自殺念慮分類モデル
このプロジェクトは、文章中の自傷・自殺念慮を示す単語の並びを検出するための機械学習ソリューションを提供することを目的としています。ELECTRAアーキテクチャを利用し、多様なデータセットでファインチューニングすることで、自傷・自殺念慮の文章と非自傷・自殺念慮の文章を区別できる強力な分類モデルを作成しました。
🚀 クイックスタート
自傷・自殺念慮検出AIモデルへようこそ!このモデルは、文章中の自傷・自殺念慮を示す単語の並びを検出するための機械学習ソリューションを提供します。
✨ 主な機能
- 文章中の自傷・自殺念慮を示す単語の並びを検出します。
- ELECTRAアーキテクチャを利用し、多様なデータセットでファインチューニングされています。
- 自傷・自殺念慮の文章と非自傷・自殺念慮の文章を区別できます。
📦 インストール
モデルを使用するには、Transformersライブラリをインストールする必要があります。
pip install transformers
💻 使用例
基本的な使用法
パイプラインアプローチを使用して、文章分類にモデルを利用できます。
from transformers import pipeline
classifier = pipeline("sentiment-analysis", model="sentinetyd/suicidality")
result = classifier("text to classify")
print(result)
高度な使用法
トークナイザーとモデルをプログラムで使用することもできます。
from transformers import AutoTokenizer, AutoModel
tokenizer = AutoTokenizer.from_pretrained("sentinetyd/suicidality")
model = AutoModel.from_pretrained("sentinetyd/suicidality")
📚 ドキュメント
ラベル
モデルは入力文章を2つのラベルに分類します。
LABEL_0
: 文章が非自傷・自殺念慮であることを示します。
LABEL_1
: 文章が自傷・自殺念慮を示していることを示します。
トレーニング
モデルは、ELECTRAアーキテクチャを使用して、慎重に選りすぐられたデータセットでファインチューニングされました。トレーニングプロセスには、様々なテキストソースのクリーニングと前処理が含まれ、包括的なトレーニングセットが作成されました。トレーニング結果は、以下のような指標を含め、有望なパフォーマンスを示しています。
パフォーマンス
検証データセットでのモデルのパフォーマンスは以下の通りです。
- 正解率: 0.939432
- 再現率: 0.937164
- 適合率: 0.92822
- F1スコア: 0.932672
これらの指標は、モデルが文章のシーケンスを自傷・自殺念慮または非自傷・自殺念慮として正確に分類する能力を示しています。
データソース
豊富で多様なトレーニングデータセットを作成するために、複数のソースからデータを収集しました。
- https://www.kaggle.com/datasets/thedevastator/c-ssrs-labeled-suicidality-in-500-anonymized-red
- https://www.kaggle.com/datasets/amangoyl/reddit-dataset-for-multi-task-nlp
- https://www.kaggle.com/datasets/imeshsonu/suicideal-phrases
- https://raw.githubusercontent.com/laxmimerit/twitter-suicidal-intention-dataset/master/twitter-suicidal_data.csv
- https://www.kaggle.com/datasets/mohanedmashaly/suicide-notes
- https://www.kaggle.com/datasets/natalialech/suicidal-ideation-on-twitter
データは、モデルのトレーニングに使用する前に、徹底的なクリーニングと前処理を行いました。
倫理的な考慮事項
自傷・自殺念慮は敏感で深刻なトピックです。このモデルを使用する際には、注意を払い、倫理的な影響を考慮することが重要です。モデルによる予測は慎重に扱われ、人間の判断と介入を補完するために使用されるべきです。
モデルのクレジット
Hugging Faceのモデルリポジトリにある「gooohjy/suicidal-electra」モデルを認めておきます。このモデルはこのリンクから見つけることができます。このモデルを出発点として使用し、自傷・自殺念慮検出モデルを作成するためにファインチューニングしました。
コントリビューション
モデルのパフォーマンスの向上、データセットの拡充、およびその責任ある展開を確保するために、コミュニティからのコントリビューションとフィードバックを歓迎します。
📄 ライセンス
このモデルはCC0-1.0ライセンスの下で提供されています。