P

Pixtral 12b

mgoinによって開発
Pixtral-12Bは、transformersライブラリと互換性のあるマルチモーダルモデルで、画像とテキストの入力を処理し、テキスト出力を生成することができ、画像理解と記述タスクに適しています。
ダウンロード数 1,943
リリース時間 : 10/18/2024

モデル概要

Pixtral-12Bは、Mistralアーキテクチャに基づくマルチモーダルモデルで、画像とテキストの統合処理をサポートし、高品質の画像記述を生成し、関連する質問に回答することができます。

モデル特徴

マルチモーダル処理
画像とテキストの入力を同時に処理し、首尾一貫したテキスト出力を生成することができます。
高品質の画像記述
シーン、物体、感情分析を含む詳細で正確な画像記述を生成することができます。
チャットテンプレートのサポート
チャットテンプレートを使用してチャット履歴を整形することをサポートし、複数回の対話を容易にします。

モデル能力

画像記述
マルチモーダル質問応答
シーン分析
物体認識

使用事例

画像理解
画像記述生成
1枚または複数枚の画像を入力すると、モデルは詳細な記述テキストを生成します。
シーン、物体、感情分析を含む詳細な記述を生成します。
マルチモーダル質問応答
画像とテキストを組み合わせた質問を行うと、モデルは関連する回答を生成します。
画像内容に基づいて関連する質問に回答し、文脈に関連する情報を提供することができます。
自然言語処理
チャットボット
複数回の対話をサポートし、画像とテキストを組み合わせて対話を行います。
首尾一貫した文脈に関連する回答を生成します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase