A

Asr Wav2vec2 Commonvoice Rw

speechbrainによって開発
これはルワンダ語の自動音声認識のためのエンドツーエンドモデルで、wav2vec 2.0事前トレーニングモデルとCTCおよびアテンションメカニズムを組み合わせ、CommonVoiceデータセットでファインチューニングされています。
ダウンロード数 28
リリース時間 : 3/2/2022

モデル概要

このモデルはルワンダ語の自動音声認識機能を提供し、トークナイザーと音響モデルの2つのモジュールを含み、16kHzサンプリングレートの音声入力をサポートします。

モデル特徴

エンドツーエンド音声認識
音声入力からテキスト出力までの完全な処理フローを提供
事前トレーニングモデルのファインチューニング
wav2vec2-large-xlsr-53事前トレーニングモデルをルワンダ語データでファインチューニング
デュアルデコードメカニズム
CTCとアテンションメカニズムを同時に使用してデコードし、認識精度を向上
自動音声処理
内蔵の音声正規化機能により、サンプリングレートとチャンネル変換を自動処理

モデル能力

ルワンダ語音声認識
音声文字起こし
バッチ音声処理

使用事例

音声文字起こし
音声からテキストへ
ルワンダ語の音声内容をテキストに変換
単語誤り率18.91%
音声アシスタント
ルワンダ語音声インタラクション
ルワンダ語音声アシスタントに認識能力を提供
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase