UI-TARS-1.5-7B-4bitオープンソースマルチモーダルモデル - 画像テキストからテキストへの変換を実現、英語のみ対応

ホーム

UI TARS 1.5 7B 4bit

mlx-communityによって開発

UI-TARS-1.5-7B-4bitはマルチモーダルモデルで、画像テキストからテキストへの変換タスクに特化しており、英語をサポートしています。

画像生成テキスト

Transformers

複数言語対応オープンソースライセンス:Apache-2.0 #マルチモーダルインタラクション #GUI理解 #4ビット量子化

ダウンロード数 184

リリース時間 : 4/25/2025

モデル概要

このモデルはByteDance-Seed/UI-TARS-1.5-7Bから変換されたMLX形式のモデルで、主に画像とテキスト間のインタラクションタスクに使用されます。

モデル特徴

マルチモーダルサポート

画像とテキスト間のインタラクションタスクを処理できます。

MLX形式

MLX形式に変換されており、特定の環境での実行が容易です。

4ビット量子化

モデルは4ビット量子化処理されており、リソース使用量を削減します。

モデル能力

画像テキスト生成

マルチモーダルインタラクション

使用事例

画像説明

画像内容の説明

入力された画像に基づいて詳細なテキスト説明を生成します。

マルチモーダルインタラクション

画像質問応答

画像の内容に基づいて関連する質問に答えます。

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

UI TARS 1.5 7B 4bit

モデル概要

モデル特徴

モデル能力

使用事例

🚀 mlx-community/UI-TARS-1.5-7B-4bit

🚀 クイックスタート

📦 インストール

💻 使用例

📄 ライセンス