U

URM LLaMa 3.1 8B

Developed by LxzGordon
URM-LLaMa-3.1-8Bは不確実性を感知できる報酬モデルで、大規模言語モデルのアライメント効果を改善します。
Downloads 4,688
Release Time : 9/12/2024

Model Overview

このモデルはベースモデルと不確実性感知能力を持つ属性特化値ヘッドで構成され、2段階のトレーニング(属性回帰とゲート層学習)を採用し、より信頼性の高い報酬信号を提供できます。

Model Features

不確実性感知
モデルは報酬信号の不確実性を推定でき、不確実性が低い信号ほど信頼性が高く、より良いアライメント効果をもたらします。
2段階トレーニング
第1段階で属性回帰トレーニングを行い、第2段階でゲート層による多属性スコアの組み合わせを学習します。
ゲート層学習
固定重みではなく、ゲート層を学習することで多属性スコアを動的に組み合わせます。

Model Capabilities

テキスト品質評価
報酬信号生成
不確実性推定
多属性評価

Use Cases

大規模言語モデルアライメント
応答品質評価
AIアシスタントが生成する応答の品質を、有用性、正確性などの観点で評価します。
図表が示すように、不確実性推定を使用することでより良いアライメント効果が得られます。
強化学習
報酬モデル
強化学習トレーニングにより信頼性の高い報酬信号を提供します。
不確実性が低い報酬信号はトレーニングの安定性を向上させます。
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase