P

Phi3 Hallucination Judge Merge

grounded-aiによって開発
このモデルは、言語モデルの出力における幻覚現象、つまり一貫性はあるが事実誤認や文脈から外れた応答を検出するために使用されます。
ダウンロード数 63
リリース時間 : 4/25/2025

モデル概要

言語モデルの出力における幻覚を検出するための専用二値分類モデルで、ファインチューニングにより高性能な幻覚検出能力を実現しています。

モデル特徴

高性能幻覚検出
幻覚検出タスクで優れた性能を発揮し、F1スコア0.81を達成、複数の先進言語モデルを上回ります。
軽量アダプター
PEFTアダプタ技術を採用し、ベースモデルを変更することなく効率的なファインチューニングを実現。
標準化プロンプト戦略
標準化された入力フォーマットとプロンプト戦略を提供し、既存システムへの迅速な統合を容易にします。

モデル能力

幻覚検出
テキスト分類
言語モデル出力評価

使用事例

言語モデル品質評価
モデル出力検証
言語モデルが生成する内容の事実正確性を検証
幻覚出力の85%を正確に識別
コンテンツモデレーション
ファクトチェック
生成コンテンツ内の事実誤りを自動検出
エラー検出の再現率87%を達成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase