R

Reflectiva

由aimagelab開發
ReflectiVA是一種多模態大語言模型,通過整合外部知識源和反思令牌機制增強視覺問答能力。
下載量 46
發布時間 : 11/25/2024

模型概述

ReflectiVA是一種創新的多模態大語言模型,能夠處理文本和圖像輸入,通過反思令牌動態判斷是否需要外部知識,並在需要時從外部數據庫檢索相關信息,從而提升基於知識的視覺問答任務性能。

模型特點

反思令牌機制
通過特殊設計的反思令牌動態判斷是否需要外部知識,實現智能知識檢索
兩階段訓練
採用雙模型訓練方案,既保持基礎性能又增強知識獲取能力
知識增強
能夠有效整合外部知識源,提升複雜視覺問答任務的準確性

模型能力

多模態理解
視覺問答
外部知識檢索
圖像-文本聯合處理

使用案例

教育
複雜視覺問答
回答需要外部知識的圖像相關問題
在基於知識的視覺問答任務中表現優於現有方法
研究
多模態研究
探索視覺與語言聯合理解的機制
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase