K

Kimi VL A3B Thinking 8bit

Developed by mlx-community
Kimi-VL-A3B-Thinking-8bitは、MLX形式に変換されたマルチモーダル視覚言語モデルで、画像テキストからテキストへの生成タスクをサポートしています。
Downloads 1,738
Release Time : 4/17/2025

Model Overview

このモデルはmoonshotai/Kimi-VL-A3B-Thinkingから変換されたもので、主に画像理解とテキスト生成タスクに使用され、入力された画像に基づいて関連するテキスト記述を生成することができます。

Model Features

マルチモーダル対応
画像とテキストの入力を同時に処理し、関連するテキスト出力を生成することができます。
高効率推論
MLX形式で最適化され、高効率な推論性能をサポートします。
多言語対応
複数の言語のテキスト生成タスクをサポートします。

Model Capabilities

画像理解
テキスト生成
マルチモーダルタスク処理

Use Cases

画像記述生成
画像内容記述
入力された画像に基づいて詳細なテキスト記述を生成します。
正確で詳細な画像記述テキストを生成します。
視覚質問応答
画像質問応答
画像内容に基づいて関連する質問に答えます。
正確な答えを提供します。
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase