# 多次元評価

Decision Tree Reward Gemma 2 27B
その他
Gemma-2-27Bをファインチューニングした決定木報酬モデルで、言語モデルが生成するコンテンツの品質評価に使用され、RewardBenchランキングで優れた性能を発揮しています。
大規模言語モデル Transformers 英語
D
RLHFlow
18
6
Modernbert Embed Base Ft Sts Spanish Matryoshka 768 64
これはmodernbert-embed-baseモデルをファインチューニングした文変換器で、文の埋め込みベクトルを生成し意味類似度を計算するために使用されます。
テキスト埋め込み
M
mrm8488
443
2
Videoscore V1.1
MIT
VideoScore-v1.1はMantis-8B-Idefics2を基にした動画品質評価モデルで、48フレーム推論をサポートし、テキストから動画への整合性サブスコアで優れた性能を発揮します。
テキスト生成ビデオ Transformers 英語
V
TIGER-Lab
703
5
Summllama3 8B
SummLlama3-8BはLlama3-8B-Instructを初期化したテキスト要約モデルで、大規模な要約フィードバックによるDPOトレーニングにより最適化され、忠実性、完全性、簡潔性に優れた性能を発揮します。
テキスト生成
S
DISLab
15
14
Selfrag Llama2 7b
MIT
70億パラメータのSelf-RAGモデルで、多様なユーザークエリに対して出力を生成し、検索システムの呼び出し、出力内容と検索段落の自己批判、反省タグの生成を自立的に行えます。
大規模言語モデル Transformers
S
selfrag
1,318
78
Unieval Intermediate
UniEvalは統一された多次元テキスト生成評価フレームワークで、事前学習評価器を通じて生成テキストの多次元総合評価を目的としています。
テキスト生成 Transformers
U
MingZhong
19
3
Unieval Dialog
UniEvalは自然言語生成タスクのための多次元評価フレームワークであり、unieval-dialogは対話応答生成タスク向けの事前学習評価器です。
対話システム Transformers
U
MingZhong
2,021
4
Unite Up
Apache-2.0
UniTEは翻訳品質を評価するための統一フレームワークで、特に英語ターゲットの翻訳タスクに最適化されています。
機械翻訳 Transformers
U
ywan
181
0
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase