gte-Qwen2-7B-instruct-GGUF開源多語言文本嵌入模型

首頁

Gte Qwen2 7B Instruct GGUF

由mradermacher開發

阿里巴巴NLP團隊開發的7B參數規模的多語言文本嵌入模型，專注於句子相似度任務，提供多種量化版本

大型語言模型英語開源協議:Apache-2.0 #英文句子嵌入 #高精度語義匹配 #輕量級部署

下載量 510

發布時間 : 2/16/2025

模型概述

基於Qwen2架構的7B參數模型，主要用於句子相似度計算和文本嵌入任務，支持英文處理

模型特點

多種量化版本

提供從Q2_K到f16共12種不同精度的量化版本，滿足不同場景需求

高效推理

經過量化處理後模型體積顯著減小，最低僅3.1GB(Q2_K)，適合資源受限環境

高質量嵌入

在MTEB等基準測試中表現優異，能夠生成高質量的句子嵌入

模型能力

句子嵌入生成

文本相似度計算

語義搜索

使用案例

信息檢索

文檔相似性搜索

在大規模文檔庫中快速查找語義相似的文檔

推薦系統

內容推薦

基於內容語義相似性生成個性化推薦

🚀 gte - Qwen2 - 7B - instruct量化模型

本項目是對https://huggingface.co/Alibaba - NLP/gte - Qwen2 - 7B - instruct 模型的靜態量化版本，提供了不同類型的量化模型文件，方便用戶在不同場景下使用。

🚀 快速開始

如果你不確定如何使用GGUF文件，請參考TheBloke的README獲取更多詳細信息，包括如何拼接多部分文件。

✨ 主要特性

提供多種量化類型的模型文件，滿足不同的存儲和性能需求。
支持多種標籤，如mteb、sentence - transformers等，適用於多種自然語言處理任務。

📚 詳細文檔

關於

本項目是https://huggingface.co/Alibaba - NLP/gte - Qwen2 - 7B - instruct 的靜態量化版本。目前，加權/矩陣量化文件（weighted/imatrix quants）似乎暫時不可用。如果在靜態量化文件發佈大約一週後它們仍未出現，可能是我沒有計劃提供。你可以通過發起社區討論來請求這些文件。

提供的量化文件

（按大小排序，不一定按質量排序。IQ量化文件通常比類似大小的非IQ量化文件更優）

鏈接	類型	大小/GB	備註
GGUF	Q2_K	3.1
GGUF	Q3_K_S	3.6
GGUF	Q3_K_M	3.9	質量較低
GGUF	Q3_K_L	4.2
GGUF	IQ4_XS	4.3
GGUF	Q4_K_S	4.6	快速，推薦
GGUF	Q4_K_M	4.8	快速，推薦
GGUF	Q5_K_S	5.4
GGUF	Q5_K_M	5.5
GGUF	Q6_K	6.4	質量非常好
GGUF	Q8_0	8.2	快速，質量最佳
GGUF	f16	15.3	16 bpw，可能過度使用