🚀 MiniCPM-V 2.6 int4
MiniCPM-V 2.6 int4 是 MiniCPM-V 2.6 的 int4 量化版本,使用该版本进行推理时,GPU 内存占用更低(约 7GB)。
🚀 快速开始
环境依赖
在 NVIDIA GPU 上使用 Huggingface transformers 进行推理。测试环境为 Python 3.10,所需依赖如下:
Pillow==10.1.0
torch==2.1.2
torchvision==0.16.2
transformers==4.40.0
sentencepiece==0.1.99
accelerate==0.30.1
bitsandbytes==0.43.1
代码示例
import torch
from PIL import Image
from transformers import AutoModel, AutoTokenizer
model = AutoModel.from_pretrained('openbmb/MiniCPM-V-2_6-int4', trust_remote_code=True)
tokenizer = AutoTokenizer.from_pretrained('openbmb/MiniCPM-V-2_6-int4', trust_remote_code=True)
model.eval()
image = Image.open('xx.jpg').convert('RGB')
question = 'What is in the image?'
msgs = [{'role': 'user', 'content': [image, question]}]
res = model.chat(
image=None,
msgs=msgs,
tokenizer=tokenizer
)
print(res)
res = model.chat(
image=None,
msgs=msgs,
tokenizer=tokenizer,
sampling=True,
temperature=0.7,
stream=True
)
generated_text = ""
for new_text in res:
generated_text += new_text
print(new_text, flush=True, end='')
✨ 主要特性
- 多语言支持:支持多种语言的处理。
- 多模态能力:支持图像、文本输入,可处理图像识别、OCR 等任务。
- 低内存占用:int4 量化版本显著降低 GPU 内存使用。
📦 安装指南
按照上述依赖列表,使用以下命令安装所需库:
pip install Pillow==10.1.0 torch==2.1.2 torchvision==0.16.2 transformers==4.40.0 sentencepiece==0.1.99 accelerate==0.30.1 bitsandbytes==0.43.1
💻 使用示例
基础用法
import torch
from PIL import Image
from transformers import AutoModel, AutoTokenizer
model = AutoModel.from_pretrained('openbmb/MiniCPM-V-2_6-int4', trust_remote_code=True)
tokenizer = AutoTokenizer.from_pretrained('openbmb/MiniCPM-V-2_6-int4', trust_remote_code=True)
model.eval()
image = Image.open('xx.jpg').convert('RGB')
question = 'What is in the image?'
msgs = [{'role': 'user', 'content': [image, question]}]
res = model.chat(
image=None,
msgs=msgs,
tokenizer=tokenizer
)
print(res)
高级用法
res = model.chat(
image=None,
msgs=msgs,
tokenizer=tokenizer,
sampling=True,
temperature=0.7,
stream=True
)
generated_text = ""
for new_text in res:
generated_text += new_text
print(new_text, flush=True, end='')
📚 详细文档
模型信息
属性 |
详情 |
模型类型 |
图像文本到文本模型 |
训练数据 |
openbmb/RLAIF-V-Dataset |
基础模型 |
openbmb/MiniCPM-V-2_6 |
最新消息
- [2025.01.14] 🔥🔥 我们开源了 MiniCPM-o 2.6,相较于 MiniCPM-V 2.6 有显著的性能提升,并且支持实时语音到语音对话和多模态直播。快来试试吧。