🚀 ONNX 版本的 distiluse-base-multilingual-cased-v2
本项目是 sentence-transformers/distiluse-base-multilingual-cased-v2 的 ONNX 转换模型。它是一个基于 sentence-transformers 的 ONNX 模型,能够将句子和段落映射到 512 维的密集向量空间,可用于聚类或语义搜索等任务。此自定义模型输出的 last_hidden_state
与原始的 sentence-transformer 实现类似。
🚀 快速开始
本模型可用于句子相似度任务,支持多语言。许可证为 Apache-2.0。
✨ 主要特性
- 基于
sentence-transformers
框架,可将文本映射到 512 维向量空间。
- 输出
last_hidden_state
与原始实现相似。
- 支持多语言输入。
📦 安装指南
在安装了 optimum 的情况下,使用本模型会很方便:
python -m pip install optimum
你可能还需要安装以下依赖:
python -m pip install onnxruntime
python -m pip install onnx
💻 使用示例
基础用法
from optimum.onnxruntime.modeling_ort import ORTModelForCustomTasks
from transformers import AutoTokenizer
model = ORTModelForCustomTasks.from_pretrained("lorenpe2/distiluse-base-multilingual-cased-v2")
tokenizer = AutoTokenizer.from_pretrained("lorenpe2/distiluse-base-multilingual-cased-v2")
inputs = tokenizer("I love burritos!", return_tensors="pt")
pred = model(**inputs)
高级用法
你还可以使用 transformers 中的管道 API:
from transformers import pipeline
onnx_extractor = pipeline("feature-extraction", model=model, tokenizer=tokenizer)
text = "I love burritos!"
pred = onnx_extractor(text)
📚 详细文档
评估结果
要对该模型进行自动评估,请参考 Sentence Embeddings Benchmark:https://seb.sbert.net
完整模型架构
SentenceTransformer(
(0): Transformer({'max_seq_length': 128, 'do_lower_case': False}) with Transformer model: DistilBertModel
(1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False})
(2): Dense({'in_features': 768, 'out_features': 512, 'bias': True, 'activation_function': 'torch.nn.modules.activation.Tanh'})
)
引用与作者
本模型由 sentence-transformers 训练。
如果你觉得该模型有帮助,请引用我们的论文 Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks:
@inproceedings{reimers-2019-sentence-bert,
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
author = "Reimers, Nils and Gurevych, Iryna",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
month = "11",
year = "2019",
publisher = "Association for Computational Linguistics",
url = "http://arxiv.org/abs/1908.10084",
}
📄 许可证
本项目采用 Apache-2.0 许可证。
属性 |
详情 |
模型类型 |
ONNX 版本的句子相似度模型 |
训练数据 |
未提及 |
支持语言 |
多语言 |
许可证 |
Apache-2.0 |