X

Xlm Roberta Capu

dragonSwingによって開発
XLM-RoBERTaをファインチューニングしたベトナム語句読点復元モデルで、小文字テキストの句読点と大文字形式を予測可能
ダウンロード数 1,722
リリース時間 : 5/11/2022

モデル概要

このモデルはベトナム語テキストの句読点と大文字形式を復元するために使用され、音声認識出力や句読点が失われたテキスト処理シナリオに適しています。一般的な句読点(. , : ?)や複雑な単語の大文字形式の復元をサポートします。

モデル特徴

複数句読点復元
句点、読点、コロン、疑問符の4つの一般的な句読点を復元可能
インテリジェント大文字変換
YouTubeやMobiFoneなどの複雑な固有名詞の大文字形式を正確に復元
長文処理
任意の長さのベトナム語テキストを処理可能で、内蔵のチャンク処理メカニズムを備える
高精度
テストセットでF1値0.89を達成、固有名詞認識精度は0.93

モデル能力

テキスト句読点復元
大文字小文字変換
ベトナム語テキスト処理
音声認識後処理

使用事例

音声認識後処理
ASR出力テキスト正規化
音声認識システムが出力した句読点なし小文字テキストを規範形式に変換
ASR出力テキストの可読性と専門性を向上
テキスト前処理
ソーシャルメディアテキスト正規化
ソーシャルメディアの非規範的ベトナム語テキストを処理
非公式テキストを公式執筆規範に適合させる
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase