モデル選定

多次元評価

# 多次元評価

Decision Tree Reward Gemma 2 27B

Gemma-2-27Bをファインチューニングした決定木報酬モデルで、言語モデルが生成するコンテンツの品質評価に使用され、RewardBenchランキングで優れた性能を発揮しています。

大規模言語モデル

Transformers 英語

Modernbert Embed Base Ft Sts Spanish Matryoshka 768 64

これはmodernbert-embed-baseモデルをファインチューニングした文変換器で、文の埋め込みベクトルを生成し意味類似度を計算するために使用されます。

テキスト埋め込み

Videoscore V1.1

VideoScore-v1.1はMantis-8B-Idefics2を基にした動画品質評価モデルで、48フレーム推論をサポートし、テキストから動画への整合性サブスコアで優れた性能を発揮します。

テキスト生成ビデオ

Transformers 英語

SummLlama3-8BはLlama3-8B-Instructを初期化したテキスト要約モデルで、大規模な要約フィードバックによるDPOトレーニングにより最適化され、忠実性、完全性、簡潔性に優れた性能を発揮します。

テキスト生成

Selfrag Llama2 7b

70億パラメータのSelf-RAGモデルで、多様なユーザークエリに対して出力を生成し、検索システムの呼び出し、出力内容と検索段落の自己批判、反省タグの生成を自立的に行えます。

大規模言語モデル

Unieval Intermediate

UniEvalは統一された多次元テキスト生成評価フレームワークで、事前学習評価器を通じて生成テキストの多次元総合評価を目的としています。

テキスト生成

UniEvalは自然言語生成タスクのための多次元評価フレームワークであり、unieval-dialogは対話応答生成タスク向けの事前学習評価器です。

対話システム

UniTEは翻訳品質を評価するための統一フレームワークで、特に英語ターゲットの翻訳タスクに最適化されています。

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase