🚀 bleurt-tiny-512 モデルカード
このモデルはACL論文に基づく元のBLEURTモデルのPytorchバージョンで、テキスト分類タスクに使用できます。
🚀 クイックスタート
以下のコードを使用して、モデルを始めることができます。
クリックして展開
from transformers import AutoModelForSequenceClassification, AutoTokenizer
import torch
tokenizer = AutoTokenizer.from_pretrained("Elron/bleurt-tiny-512")
model = AutoModelForSequenceClassification.from_pretrained("Elron/bleurt-tiny-512")
model.eval()
references = ["hello world", "hello world"]
candidates = ["hi universe", "bye world"]
with torch.no_grad():
scores = model(**tokenizer(references, candidates, return_tensors='pt'))[0].squeeze()
print(scores)
モデル変換コードについては、このノートブックを参照してください。
✨ 主な機能
📦 インストール
このセクションでは、インストールに関する具体的な手順が提供されていません。
📚 ドキュメント
モデル詳細
モデル説明
ACL論文に基づく元のBLEURTモデルのPytorchバージョンです。
- 開発者: Google ResearchのElron Bandel、Thibault Sellam、Dipanjan Das、Ankur P. Parikh
- 共有者 [任意]: Elron Bandel
- モデルタイプ: テキスト分類
- 言語 (NLP): 詳細情報が必要
- ライセンス: 詳細情報が必要
- 親モデル: BERT
- 詳細情報のリソース:
使用方法
直接使用
このモデルは、テキスト分類タスクに使用できます。
下流使用 [任意]
詳細情報が必要。
範囲外の使用
このモデルは、人々に敵対的または疎外感を与える環境を意図的に作り出すために使用してはいけません。
バイアス、リスク、制限事項
多くの研究が言語モデルのバイアスと公平性の問題を探っています(例えば、Sheng et al. (2021) と Bender et al. (2021) を参照)。このモデルによって生成された予測には、保護されたクラス、アイデンティティ特性、および敏感な社会的および職業的グループにまたがる不快で有害なステレオタイプが含まれる可能性があります。
推奨事項
ユーザー(直接および下流の両方)は、このモデルのリスク、バイアス、および制限事項を認識する必要があります。さらなる推奨事項については、詳細情報が必要です。
トレーニング詳細
トレーニングデータ
モデルの作成者は、関連論文 で以下のように述べています。
私たちは、2017年から2019年までのWMT Metrics Shared Taskの英語への言語ペアを使用しました。各年について、公式のWMTテストセットを使用しました。これには、ニュースドメインからの人間による評価が付けられた数千の文のペアが含まれています。トレーニングセットには、各年それぞれ5,360、9,492、および147,691のレコードが含まれています。
トレーニング手順
前処理
詳細情報が必要。
速度、サイズ、時間
詳細情報が必要。
評価
テストデータ、要因、メトリクス
テストデータ
2018年と2019年のテストセット([WMT Metrics Shared Taskの英語への言語ペア])は、ノイズが多いです。
要因
詳細情報が必要。
メトリクス
詳細情報が必要。
結果
詳細情報が必要。
モデル検査
詳細情報が必要。
環境影響
炭素排出量は、Lacoste et al. (2019) で提示された Machine Learning Impact calculator を使用して推定できます。
- ハードウェアタイプ: 詳細情報が必要
- 使用時間: 詳細情報が必要
- クラウドプロバイダー: 詳細情報が必要
- コンピュートリージョン: 詳細情報が必要
- 排出された炭素量: 詳細情報が必要
技術仕様 [任意]
モデルアーキテクチャと目的
詳細情報が必要。
コンピュートインフラストラクチャ
ハードウェア
詳細情報が必要。
ソフトウェア
詳細情報が必要。
引用
BibTeX:
@inproceedings{sellam2020bleurt,
title = {BLEURT: Learning Robust Metrics for Text Generation},
author = {Thibault Sellam and Dipanjan Das and Ankur P Parikh},
year = {2020},
booktitle = {Proceedings of ACL}
}
用語集 [任意]
詳細情報が必要。
詳細情報 [任意]
詳細情報が必要。
モデルカード作成者 [任意]
Elron BandelがEzi OzoaniおよびHugging Faceチームと協力して作成しました。
モデルカード連絡先
詳細情報が必要。
🔧 技術詳細
このセクションでは、具体的な技術的な説明が提供されていません。
📄 ライセンス
詳細情報が必要です。