Bleurt Base 128
BLEURTはグーグル研究院が開発したテキスト生成評価指標で、生成テキストの品質を自動的に評価するために使用されます。
ダウンロード数 143
リリース時間 : 3/2/2022
モデル概要
BLEURTは事前学習言語モデルに基づく自動評価指標で、機械生成テキストの品質を評価するように特別に設計されています。人間の評点を学習することで、生成テキストと参照テキストの類似度スコアを予測します。
モデル特徴
ロバスト性評価
テキスト生成評価における様々な課題、例えば意味的な類似性や流暢性の評価を処理するように特別に設計されています。
事前学習モデルに基づく
BERTなどの事前学習言語モデルの強力な表現能力を利用します。
人間の評点との整合性
人間の評点データを使って微調整することで、自動評点を人間の判断により一致させます。
モデル能力
テキスト品質評価
機械翻訳評価
テキスト要約評価
対話システム評価
使用事例
自然言語処理
機械翻訳品質評価
機械翻訳結果と参照翻訳の品質差を自動的に評価します。
0から1の間の類似度スコアを提供します。
テキスト要約評価
生成要約と参照要約の意味的な類似度を評価します。
要約品質指標を定量化します。
対話システム
対話応答品質評価
対話システムが生成した応答の関連性と流暢性を評価します。
比較可能な評点指標を提供します。
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98