W

Wav2vec2 Large Xlsr Luganda

lucioによって開発
facebook/wav2vec2-large-xlsr-53モデルをファインチューニングしたルガンダ語音声認識モデルで、汎用音声データセットで訓練され、単語誤り率29.52%
ダウンロード数 17
リリース時間 : 3/2/2022

モデル概要

これはルガンダ語向けに最適化された自動音声認識(ASR)モデルで、FacebookのXLSR-53アーキテクチャを基にファインチューニングされており、ルガンダ語の音声からテキストへの変換タスクに適しています。

モデル特徴

低リソース言語最適化
ルガンダ語という低リソース言語に特化して最適化され、汎用音声データセットでファインチューニングされています
言語モデル不要
追加の言語モデルサポートなしで直接使用可能
データ拡張訓練
ノイズの追加やピッチ、位相、強度の調整によるデータ拡張を行い、モデルの頑健性を向上させています

モデル能力

ルガンダ語音声認識
16kHz音声処理
バッチ音声テキスト変換

使用事例

音声文字起こし
ルガンダ語音声文字起こし
ルガンダ語の音声内容をテキストに変換
単語誤り率29.52%
音声アシスタント
ルガンダ語音声インタラクション
ルガンダ語音声アシスタントに音声認識能力を提供
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase