P

Pixtral 12b Nf4

Developed by SeanScripts
基於Mistral社區Pixtral-12B的4位量化版本,專注於圖像文本到文本任務,支持中文描述生成
Downloads 236
Release Time : 9/25/2024

Model Overview

這是一個經過NF4量化的視覺語言模型,能夠根據輸入圖像生成文本描述。基於Llava架構實現,適用於多模態理解任務。

Model Features

4位量化
使用BitsAndBytes進行NF4量化,顯著降低顯存需求
多模態理解
能夠同時處理圖像和文本輸入,實現視覺語言交互
高效推理
在RTX 4090上達到10-12標記/秒的生成速度

Model Capabilities

圖像描述生成
多模態內容理解
中文文本生成

Use Cases

內容創作
自動圖像標註
為圖像生成描述性文本
生成質量良好的自然語言描述
輔助工具
視覺障礙輔助
將視覺內容轉換為文字描述
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase