开源gte-Qwen2-1.5B-instruct-4bit-dwq模型 - 助力中英句子相似度计算与文本检索

首页

Gte Qwen2 1.5B Instruct 4bit Dwq

由 mlx-community 开发

基于Qwen2架构的1.5B参数规模的中英双语通用文本嵌入模型，专注于句子相似度计算和文本检索任务。

文本嵌入

Transformers

开源协议:Apache-2.0 #多任务文本嵌入 #高精度语义相似度 #大规模检索优化

下载量 22

发布时间 : 5/17/2025

模型简介

该模型是由阿里巴巴NLP团队开发的通用文本嵌入模型，基于Qwen2架构，支持中英双语，主要用于句子相似度计算、文本分类和检索等任务。

模型特点

强大的文本嵌入能力

在MTEB多个基准测试中表现出色，特别是在文本分类和检索任务上

双语支持

同时支持中文和英文文本处理

多任务适配

可应用于句子相似度、分类、聚类、检索等多种NLP任务

模型能力

句子相似度计算

文本分类

文本检索

文本聚类

文本重排序

使用案例

电子商务

商品评论情感分析

分析亚马逊商品评论的情感倾向

在MTEB AmazonPolarityClassification上达到96.61%准确率

商品分类

对商品描述进行分类

在MTEB AmazonCounterfactualClassification上达到83.99%准确率

金融

银行客服问题分类

对银行客户问题进行自动分类

在MTEB Banking77Classification上达到87.31%准确率

学术研究

论文聚类

对arXiv和biorxiv论文进行主题聚类

在MTEB ArxivClusteringP2P上V度量达到50.51

🚀 mlx-community/gte-Qwen2-1.5B-instruct-4bit-dwq

该模型 mlx-community/gte-Qwen2-1.5B-instruct-4bit-dwq 是使用 mlx-lm 版本 0.24.0 从 Alibaba-NLP/gte-Qwen2-1.5B-instruct 转换为 MLX 格式的。

🚀 快速开始

使用 mlx

pip install mlx-lm

from mlx_lm import load, generate

model, tokenizer = load("mlx-community/gte-Qwen2-1.5B-instruct-4bit-dwq")

prompt = "hello"

if tokenizer.chat_template is not None:
    messages = [{"role": "user", "content": prompt}]
    prompt = tokenizer.apply_chat_template(
        messages, add_generation_prompt=True
    )

response = generate(model, tokenizer, prompt=prompt, verbose=True)

📚 详细文档

模型信息

属性	详情
模型类型	从 Alibaba-NLP/gte-Qwen2-1.5B-instruct 转换为 MLX 格式的模型
训练数据	未提及

评估指标

该模型在多个 MTEB 数据集上进行了评估，以下是部分评估结果：

分类任务

数据集名称	准确率	AP	F1
MTEB AmazonCounterfactualClassification (en)	83.98507462686567	50.93015252587014	78.50416599051215
MTEB AmazonPolarityClassification	96.61065	94.89174052954196	96.60942596940565
MTEB AmazonReviewsClassification (en)	55.614000000000004	未提及	54.90553480294904
...	...	...	...