🚀 distilbert-qasports
このモデルは、自然言語処理タスクにおける質問応答性能を向上させるために、distilbert-base-uncased-distilled-squad を微調整したバージョンです。評価セットでは、以下のような良好な結果を達成しています。
🚀 クイックスタート
このモデルは、distilbert-base-uncased-distilled-squad をNoneデータセットで微調整したものです。評価セットでは、以下の結果を達成しています。
- 損失: 0.4019
- 完全一致率: 76.8699
- F1スコア: 81.3261
- 総数: 15041
- Hasans完全一致率: 76.8699
- Hasans F1スコア: 81.3261
- Hasans総数: 15041
- 最高完全一致率: 76.8699
- 最高完全一致率閾値: 0.0
- 最高F1スコア: 81.3261
- 最高F1スコア閾値: 0.0
📚 ドキュメント
モデルの説明
詳細情報は後日追加予定です。
想定される使用目的と制限
詳細情報は後日追加予定です。
学習と評価データ
詳細情報は後日追加予定です。
学習手順
学習ハイパーパラメータ
学習中に使用されたハイパーパラメータは以下の通りです。
- 学習率: 1e-05
- 学習バッチサイズ: 16
- 評価バッチサイズ: 16
- シード: 42
- 勾配蓄積ステップ: 2
- 総学習バッチサイズ: 32
- オプティマイザ: betas=(0.9,0.999) かつ epsilon=1e-08 の adamw_torch を使用。追加のオプティマイザ引数はありません。
- 学習率スケジューラのタイプ: 線形
- エポック数: 50
- 混合精度学習: Native AMP
学習結果
学習損失 |
エポック |
ステップ |
検証損失 |
完全一致率 |
F1スコア |
総数 |
Hasans完全一致率 |
Hasans F1スコア |
Hasans総数 |
最高完全一致率 |
最高完全一致率閾値 |
最高F1スコア |
最高F1スコア閾値 |
0.6782 |
0.1325 |
500 |
0.6027 |
74.4099 |
79.3976 |
15041 |
74.4099 |
79.3976 |
15041 |
74.4099 |
0.0 |
79.3976 |
0.0 |
0.569 |
0.2649 |
1000 |
0.5509 |
75.1080 |
80.1014 |
15041 |
75.1080 |
80.1014 |
15041 |
75.1080 |
0.0 |
80.1014 |
0.0 |
0.5821 |
0.3974 |
1500 |
0.5195 |
75.5535 |
80.3558 |
15041 |
75.5535 |
80.3558 |
15041 |
75.5535 |
0.0 |
80.3558 |
0.0 |
0.5814 |
0.5298 |
2000 |
0.4890 |
76.3978 |
81.0751 |
15041 |
76.3978 |
81.0751 |
15041 |
76.3978 |
0.0 |
81.0751 |
0.0 |
0.5165 |
0.6623 |
2500 |
0.4729 |
76.2117 |
80.9615 |
15041 |
76.2117 |
80.9615 |
15041 |
76.2117 |
0.0 |
80.9615 |
0.0 |
0.4822 |
0.7947 |
3000 |
0.4559 |
76.4976 |
81.2088 |
15041 |
76.4976 |
81.2088 |
15041 |
76.4976 |
0.0 |
81.2088 |
0.0 |
0.5015 |
0.9272 |
3500 |
0.4343 |
76.5308 |
81.0962 |
15041 |
76.5308 |
81.0962 |
15041 |
76.5308 |
0.0 |
81.0962 |
0.0 |
0.36 |
1.0596 |
4000 |
0.4349 |
76.5308 |
81.0828 |
15041 |
76.5308 |
81.0828 |
15041 |
76.5308 |
0.0 |
81.0828 |
0.0 |
0.4052 |
1.1921 |
4500 |
0.4257 |
76.6704 |
81.1909 |
15041 |
76.6704 |
81.1909 |
15041 |
76.6704 |
0.0 |
81.1909 |
0.0 |
0.36 |
1.3245 |
5000 |
0.4372 |
77.1624 |
81.7279 |
15041 |
77.1624 |
81.7279 |
15041 |
77.1624 |
0.0 |
81.7279 |
0.0 |
0.3597 |
1.4570 |
5500 |
0.4281 |
77.1225 |
81.7018 |
15041 |
77.1225 |
81.7018 |
15041 |
77.1225 |
0.0 |
81.7018 |
0.0 |
0.3739 |
1.5894 |
6000 |
0.4064 |
76.8566 |
81.3582 |
15041 |
76.8566 |
81.3582 |
15041 |
76.8566 |
0.0 |
81.3582 |
0.0 |
0.4176 |
1.7219 |
6500 |
0.4011 |
76.6438 |
81.0437 |
15041 |
76.6438 |
81.0437 |
15041 |
76.6438 |
0.0 |
81.0437 |
0.0 |
0.3924 |
1.8543 |
7000 |
0.3985 |
77.0560 |
81.4585 |
15041 |
77.0560 |
81.4585 |
15041 |
77.0560 |
0.0 |
81.4585 |
0.0 |
0.3453 |
1.9868 |
7500 |
0.4019 |
76.8699 |
81.3261 |
15041 |
76.8699 |
81.3261 |
15041 |
76.8699 |
0.0 |
81.3261 |
0.0 |
フレームワークバージョン
- Transformers 4.48.3
- Pytorch 2.6.0+cu124
- Datasets 3.2.0
- Tokenizers 0.21.0
📄 ライセンス
このモデルは、Apache-2.0ライセンスの下で提供されています。