B

Bleurt Large 128

Elronによって開発
BLEURTは、テキスト生成の品質を評価するための指標モデルで、事前学習されたBERTアーキテクチャに基づいており、生成されたテキストと参照テキストの類似度を自動的に評価することができます。
ダウンロード数 58
リリース時間 : 3/2/2022

モデル概要

BLEURTは、グーグル研究院が開発したテキスト生成評価指標モデルで、参照テキストと候補テキストの間の類似度を学習することで生成品質を評価します。このPyTorchバージョンは、元のBLEURTモデルの変換実装です。

モデル特徴

堅牢な評価指標
大量の人工評価データを学習することで、人間の判断と高度に一致する自動評価結果を提供することができます。
BERTアーキテクチャに基づく
事前学習されたBERTモデルを利用して、テキストの深層意味特徴を捉えます。
エンドツーエンド学習
モデル全体(事前学習と微調整段階を含む)が評価タスクに対してエンドツーエンドで最適化されています。

モデル能力

自動テキスト品質評価
生成テキストと参照テキストの類似度スコアリング
複数候補テキストの比較

使用事例

自然言語処理研究
機械翻訳評価
異なる機械翻訳システムが生成した翻訳文の品質を評価します。
人工評価と高度に相関する自動スコアを提供します。
テキスト要約評価
異なる要約システムが生成した要約と参照要約の類似度を比較します。
一部の人工評価作業を代替することができます。
モデル開発
生成モデルのチューニング
損失関数または評価指標として生成モデルの学習に使用します。
生成モデルの出力品質の改善に役立ちます。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase