G

Granite Embedding 107m Multilingual GGUF

由 bartowski 开发
IBM Granite团队开发的多语言嵌入模型量化版本,支持17种语言的文本嵌入任务,适用于检索和信息提取等场景。
下载量 15.19k
发布时间 : 12/18/2024

模型简介

该模型是基于107M参数的轻量级多语言嵌入模型,通过llama.cpp工具量化后可在资源受限环境中高效运行。特别优化了分词器并支持多种量化格式选择。

模型特点

多语言支持
支持17种语言的文本嵌入,包括英语、中文、阿拉伯语等主要语言
量化优化
提供从f16到IQ3_M共15种量化版本,可根据设备性能选择最佳平衡点
轻量高效
仅107M参数,量化后最小版本仅0.12GB,适合移动端和边缘设备部署
检索优化
在MIRACL多语言检索基准测试中表现优异,尤其擅长泰卢固语(te)和泰语(th)

模型能力

多语言文本嵌入
跨语言信息检索
语义相似度计算
低资源环境部署

使用案例

信息检索
多语言文档搜索
构建支持17种语言的文档检索系统
在泰卢固语测试集上达到ndcg@10=0.78175
跨语言内容推荐
根据用户母语推荐相关外语内容
中文到英语的跨语言检索recall@100达0.87388
语义分析
多语言聚类分析
对混合语言内容进行语义聚类
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase