P

Pixtral 12b

Developed by saujasv
Pixtral是一個基於Mistral架構的多模態模型,能夠處理圖像和文本輸入,生成文本輸出。
Downloads 2,168
Release Time : 11/7/2024

Model Overview

Pixtral是一個Transformers兼容的圖像文本到文本轉換模型,支持多圖像輸入和複雜指令處理,適用於圖像描述等場景。

Model Features

多圖像處理
支持同時處理多個圖像輸入,並能理解圖像間的關聯性
複雜指令理解
能夠理解包含圖像和文本混合輸入的複雜指令
詳細描述生成
生成內容豐富、結構清晰的圖像描述

Model Capabilities

圖像內容描述
多模態對話
場景理解
圖像關聯分析

Use Cases

內容生成
圖像描述生成
為單張或多張圖像生成詳細的內容描述
生成包含場景元素、物體特徵和上下文關係的結構化描述
輔助工具
視覺問答
回答關於圖像內容的自然語言問題
提供準確且符合圖像內容的回答
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase