I

Internlm XComposer2 Enhanced

由Coobiw開發
基於InternLM2開發的視覺語言大模型,具備卓越的圖文理解與創作能力
下載量 14
發布時間 : 2/13/2025

模型概述

InternLM-XComposer2是基於InternLM2開發的視覺語言大模型(VLLM),具備卓越的圖文理解與創作能力。包含兩個版本:InternLM-XComposer2-VL(多模態預訓練模型)和InternLM-XComposer2(專為自由式圖文交錯創作任務微調的視覺語言模型)。

模型特點

多模態理解與創作
具備卓越的圖文理解與創作能力,支持自由式圖文交錯創作
雙版本模型
提供VL預訓練模型和專為圖文創作優化的微調模型
高效推理
支持批量化訓練與flash-attn加速功能

模型能力

圖像理解
文本生成
圖文交錯創作
視覺問答

使用案例

內容創作
圖文博客創作
根據圖片自動生成詳細描述和配套文字內容
生成符合圖片內容的自然語言描述
智能問答
視覺問答
回答關於圖片內容的各類問題
準確理解圖片內容並提供相關回答
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase