R

Rut5 ASR

bond005によって開発
ruT5-baseアーキテクチャに基づいて訓練されたモデルで、ロシア語自動音声認識(ASR)出力の誤りを修正するために使用されます
ダウンロード数 62
リリース時間 : 4/6/2023

モデル概要

このモデルは特にロシア語自動音声認識システムの出力誤りを修正するために設計されており、特にWav2Vec2-Large-Ru-Golosモデルの出力結果に焦点を当てています。

モデル特徴

ロシア語ASR誤り訂正
ロシア語自動音声認識システムの出力に対して特化した誤り訂正と最適化を行います
ruT5アーキテクチャベース
強力なruT5-baseアーキテクチャを利用してシーケンス・ツー・シーケンスのテキスト生成を行います
複数データセット評価
Golos、Common Voiceなど複数のロシア語データセットで包括的な評価を行っています

モデル能力

ロシア語テキスト修正
ASR出力最適化
シーケンス・ツー・シーケンステキスト生成

使用事例

音声認識後処理
ASR出力修正
自動音声認識システムが出力したロシア語テキストの誤りを修正します
複数のデータセットで単語誤り率(WER)を大幅に低減しました
音声転写最適化
ロシア語音声転写テキストの正確性と可読性を向上させます
Common VoiceデータセットでWERを18.55%から11.60%に低減しました
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase