bge-large-en-v1.5-gguf開源嵌入模型 - 專為llama.cpp設計，CPU、GPU運行加速

Home

Bge Large En V1.5 Gguf

Developed by CompendiumLabs

提供GGUF格式的量化與非量化嵌入模型，專為llama.cpp設計。在CPU上運行時能大幅提升速度，GPU上對大型模型也有適度加速。

文本嵌入 Open Source License:MIT #英文嵌入模型 #CPU優化 #高效推理

Downloads 878

Release Time : 2/17/2024

Model Overview

這是一個基於BAAI/bge-large-en-v1.5模型轉換的GGUF格式嵌入模型，適用於llama.cpp框架，提供多種量化版本以優化性能和資源使用。

Model Features

GGUF格式優化

專為llama.cpp設計的格式，在CPU上運行速度顯著提升

多重量化選擇

提供從F32到Q4_K_M等多種量化級別，平衡精度與性能

CPU高效運行

在CPU上可實現高達30%的速度提升，精度損失極小

Model Capabilities

文本嵌入

語義相似度計算

信息檢索

Use Cases

信息檢索

文檔搜索

將查詢和文檔轉換為嵌入向量進行相似度匹配

提高搜索相關性和效率

語義分析

文本聚類

基於嵌入向量對相似文本進行分組

發現文本數據中的潛在模式和主題

文件名	量化方式	大小
bge-large-en-v1.5-f32.gguf	F32	1.3 GB
bge-large-en-v1.5-f16.gguf	F16	639 MB
bge-large-en-v1.5-q8_0.gguf	Q8_0	342 MB
bge-large-en-v1.5-q4_k_m.gguf	Q4_K_M	199 MB

Featured Recommended AI Models

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers Supports Multiple Languages

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統 Chinese

uer

2,694

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

Bge Large En V1.5 Gguf

Model Overview

Model Features

Model Capabilities

Use Cases

🚀 bge-large-en-v1.5-gguf

🚀 快速開始

✨ 主要特性

📦 可用文件

📄 許可證