🚀 bias_identificaiton45
このモデルは、大規模言語モデルにおけるバイアス識別を目的としたカスタムデータセットで微調整されたものです。入力テキストを10種類のバイアスカテゴリに分類することができます。
🚀 クイックスタート
このモデルを使用するには、Hugging Faceのtransformers
ライブラリを利用します。以下のコードでモデルをロードできます。
from transformers import AutoTokenizer, AutoModelForSequenceClassification
tokenizer = AutoTokenizer.from_pretrained("PriyaPatel/bias_identificaiton45")
model = AutoModelForSequenceClassification.from_pretrained("PriyaPatel/bias_identificaiton45")
inputs = tokenizer("Your text here", return_tensors="tf")
outputs = model(**inputs)
✨ 主な機能
- バイアス検出:文章やテキスト断片に含まれるバイアスの種類を特定し、分類します。
- 研究用途:自然言語処理モデルにおけるバイアスを分析し、理解するために利用できます。
📚 ドキュメント
モデルの説明
このモデルは、cardiffnlp/twitter-roberta-base-sentiment-latest
をベースに、バイアス識別用のカスタムデータセットで微調整されたものです。入力テキストを10種類のバイアスカテゴリに分類するように訓練されています。
想定される用途と制限
想定される用途
- バイアス検出:文章やテキスト断片に含まれるバイアスの種類を特定し、分類します。
- 研究用途:自然言語処理モデルにおけるバイアスを分析し、理解するために利用できます。
制限事項
- ドメイン依存性:このモデルは、訓練データに含まれるドメイン内のバイアス検出に最適化されています。
- 一般的な感情分析には不適切:このモデルは、一般的な感情分析や他の自然言語処理タスクには設計されていません。
訓練に使用されたデータセット
このデータセットは、言語モデルに存在する様々な定型的なバイアスを分析するために作成されました。複数の公開データセットからデータを取り込み、それぞれが特定のバイアスタイプの識別に貢献しています。
データセットのリンク: PriyaPatel/Bias_identification
バイアスのラベル付けは以下の通りです。
- Race/Color -
0
- Socioeconomic Status -
1
- Gender -
2
- Disability -
3
- Nationality -
4
- Sexual Orientation -
5
- Physical Appearance -
6
- Religion -
7
- Age -
8
- Profession -
9
訓練手順
- ベースモデル:
cardiffnlp/twitter-roberta-base-sentiment-latest
- オプティマイザ:学習率0.00001のAdam
- 損失関数:Sparse Categorical Crossentropy
- バッチサイズ:20
- エポック数:3
訓練ハイパーパラメータ
- 学習率:0.00001
- オプティマイザ:Adam
- 損失関数:Sparse Categorical Crossentropy
- バッチサイズ:20
- エポック数:3
訓練結果
- 検証損失:0.0744
- 検証精度:0.9825
- テスト損失:0.0715
- テスト精度:0.9832
モデルのロード方法
以下のコードを使用して、Hugging Faceのtransformers
ライブラリからモデルをロードできます。
from transformers import AutoTokenizer, AutoModelForSequenceClassification
tokenizer = AutoTokenizer.from_pretrained("PriyaPatel/bias_identificaiton45")
model = AutoModelForSequenceClassification.from_pretrained("PriyaPatel/bias_identificaiton45")
inputs = tokenizer("Your text here", return_tensors="tf")
outputs = model(**inputs)