G

Granite Embedding 107m Multilingual GGUF

由bartowski開發
IBM Granite團隊開發的多語言嵌入模型量化版本,支持17種語言的文本嵌入任務,適用於檢索和信息提取等場景。
下載量 15.19k
發布時間 : 12/18/2024

模型概述

該模型是基於107M參數的輕量級多語言嵌入模型,通過llama.cpp工具量化後可在資源受限環境中高效運行。特別優化了分詞器並支持多種量化格式選擇。

模型特點

多語言支持
支持17種語言的文本嵌入,包括英語、中文、阿拉伯語等主要語言
量化優化
提供從f16到IQ3_M共15種量化版本,可根據設備性能選擇最佳平衡點
輕量高效
僅107M參數,量化後最小版本僅0.12GB,適合移動端和邊緣設備部署
檢索優化
在MIRACL多語言檢索基準測試中表現優異,尤其擅長泰盧固語(te)和泰語(th)

模型能力

多語言文本嵌入
跨語言信息檢索
語義相似度計算
低資源環境部署

使用案例

信息檢索
多語言文檔搜索
構建支持17種語言的文檔檢索系統
在泰盧固語測試集上達到ndcg@10=0.78175
跨語言內容推薦
根據用戶母語推薦相關外語內容
中文到英語的跨語言檢索recall@100達0.87388
語義分析
多語言聚類分析
對混合語言內容進行語義聚類
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase