M

Mobilevlm 1.7B

由 mtgv 开发
MobileVLM是一款专为移动设备设计的轻量级多模态视觉语言模型,支持高效的图像理解和文本生成任务。
下载量 647
发布时间 : 12/31/2023

模型简介

MobileVLM是一款专为移动设备优化的多模态视觉语言模型,结合了高效的视觉和语言处理能力,适用于移动端的实时交互场景。

模型特点

移动设备优化
专为移动设备设计,支持高效的CPU和GPU推理。
多模态交互
通过高效投影器实现视觉和语言模态的跨模态交互。
高性能推理
在高通骁龙888 CPU和英伟达Jetson Orin GPU上分别达到每秒21.5和65.3个标记的推理速度。
轻量级架构
包含14亿和27亿参数的轻量级语言模型,适合移动端部署。

模型能力

图像理解
文本生成
多模态交互
移动端实时推理

使用案例

移动应用
实时图像描述
在移动设备上实时生成图像描述。
高效且低延迟的图像理解能力。
多模态聊天助手
结合图像和文本的交互式聊天助手。
支持自然语言和视觉输入的智能回复。
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase