3

360VL 70B

由qihoo360開發
360VL是基於LLama3語言模型開發的開源大型多模態模型,具備強大的圖像理解和雙語文本支持能力。
下載量 103
發布時間 : 5/16/2024

模型概述

360VL是業界首個基於LLama3-70B的開源大型多模態模型,設計了全局感知的多分支投影器架構,支持多輪圖文對話和細粒度圖像解析。

模型特點

多輪圖文對話
支持以文本和圖像作為輸入並生成文本輸出,可實現單圖多輪視覺問答。
雙語文本支持
支持中英文對話,包括圖像中的文字識別。
強大的圖像理解
擅長分析視覺內容,能高效完成圖像信息提取、整理和總結等任務。
細粒度圖像解析
支持672×672更高分辨率的圖像理解。

模型能力

視覺問答
圖像內容分析
中英文文本生成
圖像信息提取
多輪對話

使用案例

視覺問答
圖像內容問答
用戶上傳圖像並提問,模型回答關於圖像內容的問題。
能夠準確識別圖像中的對象、場景和文字信息。
圖像分析
圖像信息提取
從圖像中提取關鍵信息並進行總結。
能夠高效完成圖像信息的提取和整理。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase