Mobilevlm 1.7B
M
Mobilevlm 1.7B
由 mtgv 开发
MobileVLM是一款专为移动设备设计的轻量级多模态视觉语言模型,支持高效的图像理解和文本生成任务。
下载量 647
发布时间 : 12/31/2023
模型简介
MobileVLM是一款专为移动设备优化的多模态视觉语言模型,结合了高效的视觉和语言处理能力,适用于移动端的实时交互场景。
模型特点
移动设备优化
专为移动设备设计,支持高效的CPU和GPU推理。
多模态交互
通过高效投影器实现视觉和语言模态的跨模态交互。
高性能推理
在高通骁龙888 CPU和英伟达Jetson Orin GPU上分别达到每秒21.5和65.3个标记的推理速度。
轻量级架构
包含14亿和27亿参数的轻量级语言模型,适合移动端部署。
模型能力
图像理解
文本生成
多模态交互
移动端实时推理
使用案例
移动应用
实时图像描述
在移动设备上实时生成图像描述。
高效且低延迟的图像理解能力。
多模态聊天助手
结合图像和文本的交互式聊天助手。
支持自然语言和视觉输入的智能回复。
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers 支持多种语言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers 英语

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统 中文
R
uer
2,694
98