F

Flow Judge V0.1

由flowaicom開發
Flow Judge v0.1 是一款輕量級但功能強大的 38 億參數模型,可在多個領域對大語言模型(LLM)系統進行定製化評估。
下載量 6,094
發布時間 : 9/15/2024

模型概述

Flow Judge v0.1 是一款基於 Phi-3.5-mini 指令模型架構的輕量級評估模型,專注於對大語言模型系統的性能進行定製化評估。

模型特點

可定製評估
用戶能夠定義自己的評估標準和評分規則,使 Flow Judge 滿足特定需求,實現對 LLM 系統性能的精準評估。
多評分體系支持
支持三種不同的評分尺度,包括二元通過/失敗評分、3-李克特評分和5-李克特評分,可滿足不同粒度的評估需求。
結構化評估結果
生成帶有<feedback>和<score>標籤的結構化評估結果,包含定性反饋和數值分數。
輕量級高性能
儘管模型規模較小,但在保留數據集和域外基準測試中,其性能可與更大的模型相媲美。

模型能力

大語言模型系統評估
定製化評分
結構化反饋生成
多尺度評分

使用案例

客戶服務
客戶投訴處理評估
評估AI系統對客戶投訴郵件的回覆質量
提供詳細的反饋和評分,指出回覆中的優點和不足
內容生成
生成內容質量評估
評估AI生成內容的準確性、相關性和流暢性
根據自定義標準提供結構化評分和反饋
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase