S

Sentence Camembert Base

Lajavanessによって開発
CamemBERTベースのフランス語文埋め込みモデル。強化SBERT手法でstsbデータセットにファインチューニングされ、最先端のフランス語文類似度計算を実現
ダウンロード数 1,041
リリース時間 : 10/25/2023

モデル概要

このモデルはフランス語文間の意味的類似度計算に特化しており、CamemBERTアーキテクチャを基盤とし強化SBERT手法で最適化されています。複数のフランス語テキスト類似度ベンチマークで優れた性能を発揮

モデル特徴

強化SBERT訓練手法
先進的な強化SBERT訓練戦略を採用し、CrossEncoderと大規模モデルを組み合わせたペアサンプリング最適化を実現
複数ベンチマークでの優れた性能
STS-B、STS12-frなどのフランス語テキスト類似度ベンチマークでリーダーボードを獲得
効率的なパラメータ規模
わずか1億1000万パラメータで、より大規模なモデルと同等あるいはそれ以上の性能を達成

モデル能力

フランス語文埋め込み
文類似度計算
意味的テキストマッチング

使用事例

情報検索
類似ドキュメント検索
フランス語ドキュメントコレクションから意味的に類似したドキュメントを検索
検索精度と再現率の向上
質問応答システム
質問類似度マッチング
ユーザーの質問とナレッジベースの質問間の意味的類似度を識別
QAシステムの精度向上
テキストクラスタリング
フランス語テキストクラスタリング
意味的類似度に基づきフランス語テキストを自動グループ化
教師なしテキスト分類の実現
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase