W

Wav2vec2 Xls R 1b Russian

jonatasgrosmanによって開発
XLS-R 1Bアーキテクチャを基に微調整されたロシア語音声認識モデル、Common Voice 8.0などのデータセットでトレーニング
ダウンロード数 765
リリース時間 : 3/2/2022

モデル概要

これはロシア語に最適化された自動音声認識(ASR)モデルで、FacebookのXLS-R 1Bアーキテクチャを基に微調整されており、16kHzサンプリングレートの音声入力をサポートしています。

モデル特徴

高性能ロシア語認識
Common Voice 8.0テストセットで9.82%のWERと2.3%のCERを達成
言語モデル強化
言語モデルと組み合わせると、WERは7.08%、CERは1.87%まで低下
複数データセットトレーニング
Common Voice 8.0、Golos、Multilingual TEDxなど複数のデータセットを使用してトレーニング
ロバストな性能
ロバスト音声イベントテストデータで14.23% WERを達成

モデル能力

ロシア語音声認識
音声からテキストへの変換
16kHzサンプリングレート音声処理対応

使用事例

音声文字起こし
ロシア語音声からテキストへ
ロシア語音声コンテンツをテキストに変換
高精度な文字起こし結果
音声アシスタント
ロシア語音声コマンド認識
ロシア語音声アシスタントや制御システムの音声コマンド認識に使用
迅速かつ正確なコマンド理解
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase