C

Colbertv2 Camembert L4 Mmarcofr

由antoinelouis開發
輕量級ColBERTv2模型,專為法語語義搜索設計,支持高效的上下文匹配檢索。
下載量 533
發布時間 : 3/11/2024

模型概述

該模型基於ColBERTv2架構,專為法語語義搜索優化,能夠將查詢和文本段落編碼為詞元級別的嵌入矩陣,並通過MaxSim算子實現高效匹配。

模型特點

輕量級設計
參數數量僅54M,模型大小0.2GB,適合資源有限的環境部署。
高效檢索
使用MaxSim算子實現高效的上下文匹配檢索,支持大規模語料庫搜索。
法語優化
專門針對法語語義搜索進行訓練和優化,在mMARCO-fr數據集上表現優異。
殘差壓縮
採用ColBERTv2的殘差壓縮機制,顯著減少索引存儲空間需求。

模型能力

法語語義搜索
上下文匹配檢索
大規模語料庫索引

使用案例

信息檢索
文檔檢索系統
構建法語文檔檢索系統,快速找到與查詢語義匹配的文檔。
在mMARCO-fr數據集上達到91.9%的召回率@1000
問答系統
作為問答系統的檢索組件,快速找到與問題相關的候選段落。
MRR@10達到32.3
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase