P

Prometheus Vision 13b V1.0

由prometheus-eval開發
首個專為評估任務開發的開源視覺語言模型,與GPT-4V和人類評估者均展現出高度相關性
下載量 121
發布時間 : 1/14/2024

模型概述

普羅米修斯視覺是一個視覺語言模型,專門設計用於評估任務,能夠根據圖像、指令、待評估回答、評分標準和參考答案生成語言反饋和分數判定。

模型特點

多組件評估能力
能夠處理圖像、指令、待評估回答、評分標準和參考答案五個輸入組件,生成詳細反饋和評分
與GPT-4V高度相關
評估結果與GPT-4V和人類評估者展現出高度相關性,具備替代GPT-4V評估的潛力
細粒度評分
提供1-5分的細粒度評分,並附帶詳細的評估反饋

模型能力

圖像理解
文本生成
視覺問答
回答評估
反饋生成

使用案例

教育評估
視覺問答系統評估
評估視覺問答系統的回答質量
提供與人類評估高度一致的評分和反饋
內容審核
圖像內容合規性評估
評估圖像相關內容的合規性和適當性
生成詳細的合規性評估報告
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase