W

Wav2vec2 Luganda

cahyaによって開発
facebook/wav2vec2 - large - xlsr - 53をベースに微調整されたルガンダ語の自動音声認識モデルで、Mozillaコンテスト用に開発されました。
ダウンロード数 26
リリース時間 : 3/2/2022

モデル概要

これはルガンダ語に最適化された自動音声認識(ASR)モデルで、Wav2Vec2アーキテクチャに基づき、Common Voice 7.0版のデータセットで微調整されています。

モデル特徴

高性能な認識
ルガンダ語のテストセットで9.332%の単語誤り率(WER)と1.987%の文字誤り率(CER)を達成しました。
Common Voiceに基づく
mozilla - foundation/common_voice_7_0データセットを使用して訓練と評価を行いました。
言語モデル不要
追加の言語モデルのサポートなしで直接使用できます。

モデル能力

ルガンダ語の音声認識
16kHzのオーディオ処理

使用事例

音声から文字への変換
ルガンダ語の音声文字起こし
ルガンダ語の音声をテキストに変換します。
単語誤り率9.332%
音声技術コンテスト
Mozillaルガンダ語ASRコンテスト
Zindiプラットフォーム上のMozillaコンテスト用に開発されました。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase