O

Omnilmm 12B

由openbmb開發
OmniLMM-12B是基於EVA02-5B和Zephyr-7B-β構建的多模態大模型,通過感知器重採樣層連接,採用漸進式課程學習策略訓練,具有卓越性能、可信行為和即時多模態交互能力。
下載量 251
發布時間 : 1/31/2024

模型概述

OmniLMM-12B是一個強大的視覺問答模型,結合了視覺和語言理解能力,能夠處理複雜的多模態任務,並在多個基準測試中表現出色。

模型特點

卓越性能
在MME、MMBench、SEED-Bench等多個基準測試中超越現有LMMs,具備豐富的跨模態世界知識。
可信行為
首個通過多模態RLHF對齊技術實現可信行為的開源前沿模型,在MMHal-Bench和Object HalBench上表現優異。
即時多模態交互
與GPT-3.5結合打造即時多模態交互助手,可接收攝像頭視頻流和麥克風語音流,並輸出語音響應。

模型能力

視覺問答
多模態理解
即時交互
跨模態知識應用

使用案例

教育
視覺問答輔助學習
幫助學生通過圖像和文本結合的方式理解複雜概念。
提升學習效率和理解深度
智能助手
即時多模態交互
通過攝像頭和麥克風與用戶進行即時交互,提供語音響應。
實現類似Gemini演示視頻中的趣味案例
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase