S

Selene 1 Mini Llama 3.1 8B

由AtlaAI開發
Atla Selene Mini 是當前最先進的小型評委語言模型(SLMJ),性能可媲美體積大10倍的模型,在多個基準測試中超越GPT-4o。
下載量 2,840
發布時間 : 1/22/2025

模型概述

基於Llama-3.1-8B的後訓練模型,專為評估任務設計,支持多種評分標準和結構化評估輸出。

模型特點

高性能評估能力
在RewardBench、EvalBiasBench和AutoJ基準測試中超越GPT-4o
多任務評估支持
支持絕對評分、分類判斷和成對偏好三類評估任務
多語言支持
主要支持英語,同時兼容多種歐洲和亞洲語言
長上下文處理
支持128K的上下文長度

模型能力

文本生成
回答評估
無害性評分
邏輯一致性判斷
RAG幻覺檢測
多語言處理

使用案例

內容評估
回答質量評分
以1-5分評估回覆的質量
提供結構化評分和定性評價
無害性檢測
評估內容的安全性和無害性
識別潛在有害內容
RAG系統
幻覺檢測
檢測生成內容中的事實性錯誤
提高RAG系統的可靠性
對話系統
對話質量評估
評估對話系統的回覆質量
優化對話系統性能
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase