C

Colbertv2 Camembert L4 Mmarcofr

由 antoinelouis 开发
轻量级ColBERTv2模型,专为法语语义搜索设计,支持高效的上下文匹配检索。
下载量 533
发布时间 : 3/11/2024

模型简介

该模型基于ColBERTv2架构,专为法语语义搜索优化,能够将查询和文本段落编码为词元级别的嵌入矩阵,并通过MaxSim算子实现高效匹配。

模型特点

轻量级设计
参数数量仅54M,模型大小0.2GB,适合资源有限的环境部署。
高效检索
使用MaxSim算子实现高效的上下文匹配检索,支持大规模语料库搜索。
法语优化
专门针对法语语义搜索进行训练和优化,在mMARCO-fr数据集上表现优异。
残差压缩
采用ColBERTv2的残差压缩机制,显著减少索引存储空间需求。

模型能力

法语语义搜索
上下文匹配检索
大规模语料库索引

使用案例

信息检索
文档检索系统
构建法语文档检索系统,快速找到与查询语义匹配的文档。
在mMARCO-fr数据集上达到91.9%的召回率@1000
问答系统
作为问答系统的检索组件,快速找到与问题相关的候选段落。
MRR@10达到32.3
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase