R

Ruroberta Large Paraphrase V1

s-nlpによって開発
ruRoberta-largeで訓練されたロシア語の文類似度分類モデルで、2つの文が同義の書き換えかどうかを判断します
ダウンロード数 942
リリース時間 : 7/2/2022

モデル概要

このモデルは2つのロシア語の文の意味的等価性を予測し、テキストペアが同義の書き換え(1)か非同義の書き換え(0)かを判断できます。テキストの書き換えやスタイル変換における内容保持度の評価に適しています。

モデル特徴

複数データセット共同訓練
RuPAWS、ru_paraphraser、解毒データセットを統合し、様々なテキスト書き換えシナリオをカバー
高性能意味マッチング
複数のテストセットでROC AUCスコアが0.85を超え、最高0.906を達成
頑健なアーキテクチャ
強力なruRoberta-largeモデルを基盤とし、優れたロシア語の意味理解能力を備えています

モデル能力

ロシア語の文類似度計算
意味的等価性判断
テキスト書き換え内容保持評価
スタイル変換効果検証

使用事例

テキスト処理
書き換え検出
2つのロシア語の文が同義の書き換えかどうかを判断
意味的に同じ異なる表現を正確に識別可能
内容解毒評価
テキスト解毒処理後も原意が保持されているか評価
ROC AUCが0.857を達成
品質評価
機械翻訳評価
異なる翻訳バージョン間の意味的一貫性を評価
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase