P

Pixtral 12b

Developed by mistral-community
PixtralはMistralアーキテクチャを基にしたマルチモーダルモデルで、画像とテキスト入力を処理し、詳細なテキスト記述を生成できます。
Downloads 31.93k
Release Time : 9/13/2024

Model Overview

Pixtralは12Bパラメータのマルチモーダルモデルで、画像からテキストへのタスク向けに設計されており、画像内容を理解し詳細な記述や質問への回答を生成できます。

Model Features

マルチモーダル能力
画像とテキスト入力を同時に処理し、一貫性のあるテキスト出力を生成できます。
大規模パラメータ
12Bパラメータの規模により、強力な理解と生成能力を備えています。
柔軟な入力形式
URLまたはローカルパスを通じて画像をロードでき、チャットテンプレートで入力をフォーマットできます。

Model Capabilities

画像記述生成
マルチイメージ分析
画像質問応答
マルチモーダル対話

Use Cases

コンテンツ生成
画像記述生成
単一または複数の画像に対して詳細なテキスト記述を生成します。
画像の詳細、背景、感情的なニュアンスを含む記述テキストを生成します。
質問応答システム
画像関連質問回答
画像内容に基づいてユーザーの質問に回答します。
画像内容に関連する正確な回答と説明を提供します。
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase