🚀 deberta-v3-large_boolq
このモデルは、boolqデータセットでmicrosoft/deberta-v3-largeをファインチューニングしたバージョンです。評価セットでは以下の結果を達成しています。
🚀 クイックスタート
このモデルは、boolqデータセットでmicrosoft/deberta-v3-largeをファインチューニングしたものです。評価セットでは、損失が0.4601、正解率が0.8835という結果を得ています。
✨ 主な機能
このモデルは、テキスト分類タスクに特化しており、boolqデータセットで訓練されています。
📦 インストール
このREADMEには具体的なインストール手順が記載されていないため、このセクションは省略されます。
💻 使用例
基本的な使用法
import torch
from transformers import AutoModelForSequenceClassification, AutoTokenizer
model = AutoModelForSequenceClassification.from_pretrained("nfliu/deberta-v3-large_boolq")
tokenizer = AutoTokenizer.from_pretrained("nfliu/deberta-v3-large_boolq")
examples = [
("Lake Tahoe is in California", "Lake Tahoe is a popular tourist spot in California."),
("Water is wet", "Contrary to popular belief, water is not wet.")
]
encoded_input = tokenizer(examples, padding=True, truncation=True, return_tensors="pt")
with torch.no_grad():
model_output = model(**encoded_input)
probabilities = torch.softmax(model_output.logits, dim=-1).cpu().tolist()
probability_no = [round(prob[0], 2) for prob in probabilities]
probability_yes = [round(prob[1], 2) for prob in probabilities]
for example, p_no, p_yes in zip(examples, probability_no, probability_yes):
print(f"Question: {example[0]}")
print(f"Context: {example[1]}")
print(f"p(No | question, context): {p_no}")
print(f"p(Yes | question, context): {p_yes}")
print()
📚 ドキュメント
モデルの説明
詳細な情報はありません。
想定される用途と制限
詳細な情報はありません。
訓練と評価データ
詳細な情報はありません。
訓練手順
訓練ハイパーパラメータ
訓練中に以下のハイパーパラメータが使用されました。
- 学習率: 1e-05
- 訓練バッチサイズ: 16
- 評価バッチサイズ: 8
- シード: 42
- 勾配蓄積ステップ: 2
- 総訓練バッチサイズ: 32
- オプティマイザ: Adam (betas=(0.9,0.999), epsilon=1e-08)
- 学習率スケジューラの種類: 線形
- エポック数: 5.0
訓練結果
訓練損失 |
エポック |
ステップ |
検証損失 |
正解率 |
記録なし |
0.85 |
250 |
0.5306 |
0.8823 |
0.1151 |
1.69 |
500 |
0.4601 |
0.8835 |
0.1151 |
2.54 |
750 |
0.5897 |
0.8792 |
0.0656 |
3.39 |
1000 |
0.6477 |
0.8804 |
0.0656 |
4.24 |
1250 |
0.6847 |
0.8838 |
フレームワークのバージョン
- Transformers 4.32.1
- Pytorch 2.0.1+cu117
- Datasets 2.14.4
- Tokenizers 0.13.3
📄 ライセンス
このモデルはMITライセンスの下で提供されています。
プロパティ |
詳細 |
モデルタイプ |
ファインチューニングされたモデル |
訓練データ |
boolqデータセット |