VL-Rethinker-7B-8bitオープンソースマルチモーダルモデル - 無料でデプロイし、視覚質問応答タスクを支援

ホーム

VL Rethinker 7B 8bit

mlx-communityによって開発

VL-Rethinker-7B-8bit は Qwen2.5-VL-7B-Instruct をベースとしたマルチモーダルモデルで、視覚質問応答タスクをサポートします。

テキスト生成画像

Transformers

英語オープンソースライセンス:Apache-2.0 #マルチモーダルQA #視覚理解 #8ビット量子化

ダウンロード数 21

リリース時間 : 4/16/2025

モデル概要

このモデルはマルチモーダルモデルであり、視覚と言語情報を処理でき、主に視覚質問応答タスクに使用されます。

モデル特徴

マルチモーダルサポート

視覚と言語情報を同時に処理でき、複雑な視覚質問応答タスクに適しています。

8ビット量子化

モデルは8ビット量子化処理されており、計算リソース要件を低減しています。

MLX互換

MLXフレームワーク上で動作をサポートし、Appleデバイスでのパフォーマンスを最適化しています。

モデル能力

視覚質問応答

画像キャプション生成

マルチモーダル推論

使用事例

教育

視覚質問応答システム

教育現場での視覚質問応答に使用され、学生が画像内容を理解するのを助けます。

研究

マルチモーダル研究

マルチモーダルモデルの研究開発に使用されます。

属性	详情
モデルタイプ	Visual Question Answering
ベースモデル	Qwen/Qwen2.5-VL-7B-Instruct
言語	en
タグ	transformers, multimodal, mlx
パイプラインタグ	visual-question-answering
ライセンス	apache-2.0

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

VL Rethinker 7B 8bit

モデル概要

モデル特徴

モデル能力

使用事例

🚀 mlx-community/VL-Rethinker-7B-8bit

🚀 クイックスタート

📦 インストール

💻 使用例

基本的な使用法

📄 ライセンス

📋 モデル情報