U

UI TARS 1.5 7B 6bit

由mlx-community開發
UI-TARS-1.5-7B-6bit 是一個基於 MLX 格式轉換的視覺語言模型,支持圖像理解和文本生成任務。
下載量 1,110
發布時間 : 4/25/2025

模型概述

該模型是從 ByteDance-Seed/UI-TARS-1.5-7B 轉換而來,主要用於處理圖像和文本的多模態任務,能夠根據圖像生成相關描述或回答相關問題。

模型特點

多模態能力
能夠同時處理圖像和文本輸入,實現跨模態理解與生成
高效推理
使用6位量化技術,降低計算資源需求
MLX 兼容
專為 MLX 框架優化,可在蘋果芯片上高效運行

模型能力

圖像描述生成
視覺問答
多模態推理

使用案例

內容生成
圖像描述生成
為給定圖像生成詳細描述
可生成準確反映圖像內容的自然語言描述
智能交互
視覺問答系統
回答關於圖像內容的自然語言問題
能夠理解圖像內容並給出相關回答
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase