gte-Qwen2-1.5B-instruct-GGUF開源模型 - 免費用於句子相似度計算與文本嵌入

Gte Qwen2 1.5B Instruct GGUF

由mradermacher開發

基於阿里巴巴NLP/gte-Qwen2-1.5B-instruct的量化版本，主要用於句子相似度計算和文本嵌入任務。

下載量 365

發布時間 : 2/16/2025

模型概述

這是一個1.5B參數的文本嵌入模型，經過量化處理以優化推理效率，支持英文文本處理，適用於句子相似度計算等自然語言處理任務。

多量化版本

提供從Q2_K到f16共12種量化版本，滿足不同場景下的精度和效率需求

高效推理

量化版本顯著減小模型體積並提升推理速度，適合資源受限環境

句子嵌入

專為句子相似度計算優化，可生成高質量的文本嵌入表示

文本嵌入生成

句子相似度計算

語義搜索

文本聚類

信息檢索

語義搜索

基於語義而非關鍵詞匹配的文檔檢索系統

提升搜索結果的相關性

文本分析

文檔去重

通過句子嵌入識別語義相似的重複文檔

提高文本處理效率

本項目是對Alibaba-NLP/gte-Qwen2-1.5B-instruct模型的靜態量化版本，提供了不同類型的量化文件，方便用戶在不同場景下使用。

如果你不確定如何使用GGUF文件，請參考TheBloke的README獲取更多詳細信息，包括如何拼接多部分文件。

基礎模型：基於Alibaba-NLP/gte-Qwen2-1.5B-instruct模型進行量化。
支持語言：英文。
庫名稱：transformers。
許可證：apache-2.0。
量化者：mradermacher。
標籤：包含mteb、sentence-transformers、transformers、Qwen2、sentence-similarity等標籤。

本項目是對https://huggingface.co/Alibaba-NLP/gte-Qwen2-1.5B-instruct的靜態量化。目前，加權/矩陣量化文件似乎不可用。如果在靜態量化文件發佈大約一週後它們仍未出現，可能是我沒有計劃提供。你可以通過發起社區討論來請求這些文件。

（按大小排序，不一定按質量排序。IQ量化通常比類似大小的非IQ量化更可取）

鏈接	類型	大小/GB	備註
GGUF	Q2_K	0.9
GGUF	Q3_K_S	1.0
GGUF	Q3_K_M	1.0	質量較低
GGUF	Q3_K_L	1.1
GGUF	IQ4_XS	1.1
GGUF	Q4_K_S	1.2	快速，推薦
GGUF	Q4_K_M	1.2	快速，推薦
GGUF	Q5_K_S	1.4
GGUF	Q5_K_M	1.4
GGUF	Q6_K	1.6	質量非常好
GGUF	Q8_0	2.0	快速，質量最佳
GGUF	f16	3.7	16位每權重，過度配置