U

UI TARS 1.5 7B 6bit

由 mlx-community 开发
UI-TARS-1.5-7B-6bit 是一个基于 MLX 格式转换的视觉语言模型,支持图像理解和文本生成任务。
下载量 1,110
发布时间 : 4/25/2025

模型简介

该模型是从 ByteDance-Seed/UI-TARS-1.5-7B 转换而来,主要用于处理图像和文本的多模态任务,能够根据图像生成相关描述或回答相关问题。

模型特点

多模态能力
能够同时处理图像和文本输入,实现跨模态理解与生成
高效推理
使用6位量化技术,降低计算资源需求
MLX 兼容
专为 MLX 框架优化,可在苹果芯片上高效运行

模型能力

图像描述生成
视觉问答
多模态推理

使用案例

内容生成
图像描述生成
为给定图像生成详细描述
可生成准确反映图像内容的自然语言描述
智能交互
视觉问答系统
回答关于图像内容的自然语言问题
能够理解图像内容并给出相关回答
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase