S

Sts Distilcamembert Base

由h4c5開發
這是一個基於DistilCamemBERT的法語句子嵌入模型,能夠將句子或段落編碼為768維向量,用於句子相似度計算等任務。
下載量 48
發布時間 : 2/26/2024

模型概述

該模型是通過微調DistilCamemBERT基礎模型並使用sentence-transformers庫得到的,專門用於法語句子相似度計算和特徵提取任務。

模型特點

高效蒸餾模型
基於DistilCamemBERT,參數數量減半,推理時間更短,同時保持較好的性能。
法語句子嵌入
專門針對法語文本優化,能夠生成高質量的句子嵌入表示。
高相似度計算精度
在STSb法語數據集上達到0.8165的皮爾遜相關係數,表現優異。

模型能力

法語句子嵌入
句子相似度計算
文本特徵提取

使用案例

文本相似度
語義搜索
可用於構建法語語義搜索引擎,根據查詢與文檔的語義相似度返回結果。
重複內容檢測
識別不同表述但語義相似的文本內容,用於內容去重。
信息檢索
文檔聚類
基於句子嵌入對法語文檔進行聚類分析。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase