U

UI TARS 1.5 7B 6bit

Developed by mlx-community
UI-TARS-1.5-7B-6bitは、MLX形式に変換されたビジュアル言語モデルで、画像理解とテキスト生成タスクをサポートします。
Downloads 1,110
Release Time : 4/25/2025

Model Overview

このモデルはByteDance - Seed/UI-TARS-1.5-7Bから変換されたもので、主に画像とテキストのマルチモーダルタスクを処理するために使用され、画像に基づいて関連する記述を生成したり、関連する質問に回答したりすることができます。

Model Features

マルチモーダル能力
画像とテキストの入力を同時に処理し、クロスモーダルの理解と生成を実現することができます
高効率推論
6ビット量子化技術を使用して、計算リソースの要件を削減します
MLX互換性
MLXフレームワーク用に最適化されており、Appleチップ上で高効率に動作します

Model Capabilities

画像記述生成
ビジュアル質問応答
マルチモーダル推論

Use Cases

コンテンツ生成
画像記述生成
与えられた画像に対して詳細な記述を生成します
画像の内容を正確に反映した自然言語の記述を生成することができます
スマートインタラクション
ビジュアル質問応答システム
画像の内容に関する自然言語の質問に回答します
画像の内容を理解し、関連する回答を提供することができます
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase