bge-large-en-v1.5-gguf開源嵌入模型 - 專為llama.cpp設計，CPU、GPU運行加速

首頁

Bge Large En V1.5 Gguf

由CompendiumLabs開發

提供GGUF格式的量化與非量化嵌入模型，專為llama.cpp設計。在CPU上運行時能大幅提升速度，GPU上對大型模型也有適度加速。

文本嵌入開源協議:MIT #英文嵌入模型 #CPU優化 #高效推理

下載量 878

發布時間 : 2/17/2024

模型概述

這是一個基於BAAI/bge-large-en-v1.5模型轉換的GGUF格式嵌入模型，適用於llama.cpp框架，提供多種量化版本以優化性能和資源使用。

模型特點

GGUF格式優化

專為llama.cpp設計的格式，在CPU上運行速度顯著提升

多重量化選擇

提供從F32到Q4_K_M等多種量化級別，平衡精度與性能

CPU高效運行

在CPU上可實現高達30%的速度提升，精度損失極小

模型能力

文本嵌入

語義相似度計算

信息檢索

使用案例

信息檢索

文檔搜索

將查詢和文檔轉換為嵌入向量進行相似度匹配

提高搜索相關性和效率

語義分析

文本聚類

基於嵌入向量對相似文本進行分組

發現文本數據中的潛在模式和主題

文件名	量化方式	大小
bge-large-en-v1.5-f32.gguf	F32	1.3 GB
bge-large-en-v1.5-f16.gguf	F16	639 MB
bge-large-en-v1.5-q8_0.gguf	Q8_0	342 MB
bge-large-en-v1.5-q4_k_m.gguf	Q4_K_M	199 MB

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Bge Large En V1.5 Gguf

模型概述

模型特點

模型能力

使用案例

🚀 bge-large-en-v1.5-gguf

🚀 快速開始

✨ 主要特性

📦 可用文件

📄 許可證