🚀 Siglip-base-patch16-224模型适配Transformers.js
本项目将 google/siglip-base-patch16-224
模型转换为ONNX权重,以适配 Transformers.js
库,可用于零样本图像分类等任务。
🚀 快速开始
本模型基于 google/siglip-base-patch16-224
,使用 Transformers.js
库实现零样本图像分类。
📦 安装指南
如果你还没有安装 Transformers.js
JavaScript 库,可以使用以下命令从 NPM 进行安装:
npm i @xenova/transformers
💻 使用示例
基础用法
零样本图像分类
使用 Xenova/siglip-base-patch16-224
进行零样本图像分类:
import { pipeline } from '@xenova/transformers';
const classifier = await pipeline('zero-shot-image-classification', 'Xenova/siglip-base-patch16-224');
const url = 'http://images.cocodataset.org/val2017/000000039769.jpg';
const output = await classifier(url, ['2 cats', '2 dogs'], {
hypothesis_template: 'a photo of {}',
});
console.log(output);
高级用法
计算文本嵌入
使用 SiglipTextModel
计算文本嵌入:
import { AutoTokenizer, SiglipTextModel } from '@xenova/transformers';
const tokenizer = await AutoTokenizer.from_pretrained('Xenova/siglip-base-patch16-224');
const text_model = await SiglipTextModel.from_pretrained('Xenova/siglip-base-patch16-224');
const texts = ['a photo of 2 cats', 'a photo of 2 dogs'];
const text_inputs = tokenizer(texts, { padding: 'max_length', truncation: true });
const { pooler_output } = await text_model(text_inputs);
计算视觉嵌入
使用 SiglipVisionModel
计算视觉嵌入:
import { AutoProcessor, SiglipVisionModel, RawImage} from '@xenova/transformers';
const processor = await AutoProcessor.from_pretrained('Xenova/siglip-base-patch16-224');
const vision_model = await SiglipVisionModel.from_pretrained('Xenova/siglip-base-patch16-224');
const image = await RawImage.read('https://huggingface.co/datasets/Xenova/transformers.js-docs/resolve/main/football-match.jpg');
const image_inputs = await processor(image);
const { pooler_output } = await vision_model(image_inputs);
📚 详细文档
模型信息
属性 |
详情 |
基础模型 |
google/siglip-base-patch16-224 |
库名称 |
transformers.js |
任务类型 |
零样本图像分类 |
注意事项
⚠️ 重要提示
为ONNX权重单独创建一个仓库是一种临时解决方案,直到WebML获得更多关注。如果你想让你的模型适用于Web,我们建议使用 🤗 Optimum 将其转换为ONNX,并像本仓库一样组织你的仓库(将ONNX权重放在名为 onnx
的子文件夹中)。