開源gte-Qwen2-1.5B-instruct-4bit-dwq模型 - 助力中英句子相似度計算與文本檢索

首頁

Gte Qwen2 1.5B Instruct 4bit Dwq

由mlx-community開發

基於Qwen2架構的1.5B參數規模的中英雙語通用文本嵌入模型，專注於句子相似度計算和文本檢索任務。

文本嵌入

Transformers

開源協議:Apache-2.0 #多任務文本嵌入 #高精度語義相似度 #大規模檢索優化

下載量 22

發布時間 : 5/17/2025

模型概述

該模型是由阿里巴巴NLP團隊開發的通用文本嵌入模型，基於Qwen2架構，支持中英雙語，主要用於句子相似度計算、文本分類和檢索等任務。

模型特點

強大的文本嵌入能力

在MTEB多個基準測試中表現出色，特別是在文本分類和檢索任務上

雙語支持

同時支持中文和英文文本處理

多任務適配

可應用於句子相似度、分類、聚類、檢索等多種NLP任務

模型能力

句子相似度計算

文本分類

文本檢索

文本聚類

文本重排序

使用案例

電子商務

商品評論情感分析

分析亞馬遜商品評論的情感傾向

在MTEB AmazonPolarityClassification上達到96.61%準確率

商品分類

對商品描述進行分類

在MTEB AmazonCounterfactualClassification上達到83.99%準確率

金融

銀行客服問題分類

對銀行客戶問題進行自動分類

在MTEB Banking77Classification上達到87.31%準確率

學術研究

論文聚類

對arXiv和biorxiv論文進行主題聚類

在MTEB ArxivClusteringP2P上V度量達到50.51

🚀 mlx-community/gte-Qwen2-1.5B-instruct-4bit-dwq

該模型 mlx-community/gte-Qwen2-1.5B-instruct-4bit-dwq 是使用 mlx-lm 版本 0.24.0 從 Alibaba-NLP/gte-Qwen2-1.5B-instruct 轉換為 MLX 格式的。

🚀 快速開始

使用 mlx

pip install mlx-lm

from mlx_lm import load, generate

model, tokenizer = load("mlx-community/gte-Qwen2-1.5B-instruct-4bit-dwq")

prompt = "hello"

if tokenizer.chat_template is not None:
    messages = [{"role": "user", "content": prompt}]
    prompt = tokenizer.apply_chat_template(
        messages, add_generation_prompt=True
    )

response = generate(model, tokenizer, prompt=prompt, verbose=True)

📚 詳細文檔

模型信息

屬性	詳情
模型類型	從 Alibaba-NLP/gte-Qwen2-1.5B-instruct 轉換為 MLX 格式的模型
訓練數據	未提及

評估指標

該模型在多個 MTEB 數據集上進行了評估，以下是部分評估結果：

分類任務

數據集名稱	準確率	AP	F1
MTEB AmazonCounterfactualClassification (en)	83.98507462686567	50.93015252587014	78.50416599051215
MTEB AmazonPolarityClassification	96.61065	94.89174052954196	96.60942596940565
MTEB AmazonReviewsClassification (en)	55.614000000000004	未提及	54.90553480294904
...	...	...	...