W

Wav2vec2 Luganda

indonesian-nlpによって開発
Facebookのwav2vec2-large-xlsr-53モデルをファインチューニングしたルガンダ語自動音声認識システムで、Common Voiceルガンダ語データセットで7.53%のWERを達成。
ダウンロード数 52
リリース時間 : 3/2/2022

モデル概要

ルガンダ語向けに設計された自動音声認識モデルで、ルガンダ語音声をテキストに変換するのに適しています。

モデル特徴

高精度
Common Voiceルガンダ語テストセットで7.53%の単語誤り率(WER)を達成
強力なベースモデル
Facebookのwav2vec2-large-xlsr-53モデルをベースにファインチューニングされており、優れた音声特徴抽出能力を継承
KenLM言語モデル対応
KenLM言語モデルと組み合わせることで認識精度をさらに向上可能

モデル能力

ルガンダ語音声認識
16kHz音声処理
バッチ音声テキスト変換

使用事例

音声書き起こし
ルガンダ語音声転写
ルガンダ語音声コンテンツをテキストに変換
7.53%の単語誤り率
音声アシスタント
ルガンダ語音声インタラクション
ルガンダ語音声アシスタントに音声認識機能を提供
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase