M

Mixtral AI Vision 128k 7b

由 LeroyDyer 开发
一个结合视觉与语言能力的多模态模型,通过合并方法实现图像与文本交互功能
下载量 384
发布时间 : 3/22/2024

模型简介

该模型通过线性合并方法融合了多个基础模型,具备视觉与语言交互能力,支持图像理解和文本生成

模型特点

多模态能力
支持图像与文本的交互,实现视觉功能
模型合并技术
使用线性合并方法将多个基础模型融合
视觉兼容性
通过mmproj文件支持多种兼容模型的视觉能力

模型能力

图像理解
文本生成
多模态交互

使用案例

多模态交互
图像描述生成
根据输入图像生成相关文本描述
视觉问答
基于图像内容回答相关问题
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase