D

Diffcse Bert Base Uncased Sts

voidismによって開発
DiffCSEは、文の差異に敏感な文埋め込みを学習するための教師なし対照学習フレームワークで、ランダムマスキングとマスク言語モデルによるサンプリングを用いて編集文を生成し、意味的テキスト類似性タスクの性能を向上させます。
ダウンロード数 50
リリース時間 : 4/13/2022

モデル概要

DiffCSEは、元の文と編集された文との間の差異に敏感な文埋め込みを学習します。編集された文は、元の文をランダムにマスキングし、マスク言語モデルからサンプリングすることで得られます。この手法は、教師なし文表現学習において最先端の結果を達成しています。

モデル特徴

差異敏感な文埋め込み
元の文と編集された文との間の差異に敏感な表現を学習することで、意味理解能力を向上させます
教師なし対照学習
ラベル付きデータを必要とせず、自己教師信号を利用して高品質な文表現を学習します
等変対照学習
対照学習フレームワークを一般化し、特定の拡張には不感で他の拡張には敏感な表現を学習します

モデル能力

文埋め込み生成
意味的類似度計算
テキスト表現学習

使用事例

意味理解
意味的テキスト類似性
2つの文の間の意味的類似度を計算します
STSタスクにおいて教師なしSimCSEよりも2.3絶対ポイント高い性能
情報検索
文書検索
意味的類似度に基づく文書検索システム
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase