🚀 roberta-base-japanese-jsnli
このモデルは、nlp-waseda/roberta-base-japanese を JSNLI データセットでファインチューニングしたバージョンです。評価セットでは以下の結果を達成しています。
🚀 クイックスタート
✨ 主な機能
このモデルは、自然言語推論(NLI)やゼロショット分類などのタスクに適用できます。
📦 インストール
インストールに関する具体的な手順は提供されていません。
💻 使用例
基本的な使用法
from transformers import pipeline
from pyknp import Juman
juman = Juman()
classifier = pipeline("zero-shot-classification", model="Formzu/roberta-base-japanese-jsnli")
sequence_to_classify = " ".join([tok.midasi for tok in juman.analysis("いつか世界を見る。").mrph_list()])
candidate_labels = ['旅行', '料理', '踊り']
out = classifier(sequence_to_classify, candidate_labels, hypothesis_template="この 例 は {} です 。")
print(out)
高度な使用法
from transformers import AutoTokenizer, AutoModelForSequenceClassification
import torch
from pyknp import Juman
juman = Juman()
device = torch.device("cuda") if torch.cuda.is_available() else torch.device("cpu")
model_name = "Formzu/roberta-base-japanese-jsnli"
model = AutoModelForSequenceClassification.from_pretrained(model_name).to(device)
tokenizer = AutoTokenizer.from_pretrained(model_name)
premise = " ".join([tok.midasi for tok in juman.analysis("いつか世界を見る。").mrph_list()])
label = '旅行'
hypothesis = f'この 例 は {label} です 。'
input = tokenizer.encode(premise, hypothesis, return_tensors='pt').to(device)
with torch.no_grad():
logits = model(input)["logits"][0]
probs = logits.softmax(dim=-1)
print(probs.cpu().numpy(), logits.cpu().numpy())
📚 ドキュメント
訓練手順
訓練ハイパーパラメータ
訓練中に使用されたハイパーパラメータは以下の通りです。
- learning_rate: 2e-05
- train_batch_size: 32
- eval_batch_size: 32
- seed: 42
- optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
- lr_scheduler_type: linear
- num_epochs: 3.0
訓練結果
訓練損失 |
エポック |
ステップ |
検証損失 |
正解率 |
0.4067 |
1.0 |
16657 |
0.2224 |
0.9201 |
0.3397 |
2.0 |
33314 |
0.2152 |
0.9208 |
0.2775 |
3.0 |
49971 |
0.2039 |
0.9328 |
フレームワークバージョン
- Transformers 4.21.2
- Pytorch 1.12.1+cu116
- Datasets 2.4.0
- Tokenizers 0.12.1
🔧 技術詳細
入力テキストは、事前に Juman++ で単語に分割する必要があります。
📄 ライセンス
このモデルは CC BY-SA 4.0 ライセンスの下で提供されています。
情報テーブル
属性 |
詳情 |
モデルタイプ |
テキスト分類モデル |
訓練データ |
JSNLI |
メトリクス |
正解率 |
パイプラインタグ |
テキスト分類 |
モデルインデックス
- 名前: roberta-base-japanese-jsnli
- 結果:
- タスク:
- データセット:
- タイプ: snli
- 名前: JSNLI
- 分割: dev
- メトリクス:
- タイプ: 正解率
- 値: 0.9328
- 検証済み: false
ウィジェット
- テキスト: "あなた が 好きです 。 あなた を 愛して い ます 。"