V

VL Rethinker 7B 6bit

mlx-communityによって開発
これはQwen2.5-VL-7B-Instructをベースにしたマルチモーダルモデルで、視覚QAタスクをサポートし、Appleチップ上で効率的に動作するようMLXフォーマットに変換されています。
ダウンロード数 19
リリース時間 : 4/16/2025

モデル概要

このモデルは視覚言語モデルで、画像内容を理解・分析し関連する質問に答えることができます。Qwen2.5アーキテクチャをベースにしており、6bit精度に量子化処理されています。

モデル特徴

マルチモーダル理解
視覚と言語情報を同時に処理し、画像内容を理解して質問に答えることが可能
MLX最適化
Appleチップ向けに最適化されており、Macデバイスで効率的に動作
量子化バージョン
6bit量子化バージョンで、性能を維持しながらメモリ使用量を削減

モデル能力

画像内容理解
視覚QA
マルチモーダル推論

使用事例

教育
画像学習支援
教材中の画像内容を学生が理解するのを支援
学習効率と理解深度の向上
コンテンツモデレーション
画像内容分析
アップロードされた画像の内容を自動識別・分析
コンテンツモデレーションの効率と精度向上
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase