S

Sentence Camembert Base

由Lajavaness開發
基於CamemBERT的法語句子嵌入模型,通過增強SBERT方法在stsb數據集上微調,實現最先進的法語句子相似度計算
下載量 1,041
發布時間 : 10/25/2023

模型概述

該模型專門用於計算法語句子之間的語義相似度,基於CamemBERT架構並通過增強SBERT方法優化,在多個法語文本相似度基準測試中表現優異

模型特點

增強SBERT訓練方法
採用先進的增強SBERT訓練策略,結合CrossEncoder和大型模型進行配對採樣優化
多基準測試優異表現
在STS-B、STS12-fr等多個法語文本相似度基準測試中取得領先成績
高效參數規模
僅110M參數即達到與更大模型相當甚至更好的性能

模型能力

法語句子嵌入
句子相似度計算
語義文本匹配

使用案例

信息檢索
相似文檔檢索
在法語文檔庫中查找語義相似的文檔
提高檢索準確率和召回率
問答系統
問題相似度匹配
識別用戶問題與知識庫問題的語義相似度
提升問答系統準確率
文本聚類
法語文本聚類
基於語義相似度對法語文本進行自動分組
實現無監督的文本分類
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase