A

Asr Wav2vec2 Dvoice Wolof

speechbrainによって開発
これはウォロフ語に特化した自動音声認識モデルで、wav2vec 2.0アーキテクチャに基づき、DVoiceデータセットで訓練され、ウォロフ語の音声を文字起こしすることができます。
ダウンロード数 44
リリース時間 : 6/9/2022

モデル概要

このモデルはエンドツーエンドの自動音声認識システムで、事前学習されたwav2vec 2.0モデルとCTC/Attentionメカニズムを組み合わせ、ウォロフ語の音声認識タスクに特化しています。

モデル特徴

事前学習モデルの微調整
facebook/wav2vec2-large-xlsr-53の事前学習モデルをベースに微調整し、大規模事前学習の利点を十分に活用します。
エンドツーエンドの解決策
音声入力からテキスト出力までの完全なプロセスを提供し、音声の前処理と文字起こしを含みます。
低リソース言語のサポート
ウォロフ語のような低リソース言語に特化して最適化されており、アフリカ言語技術の発展に貢献します。

モデル能力

ウォロフ語音声認識
音声ファイルの文字起こし
リアルタイム音声のテキスト変換

使用事例

音声文字起こし
ウォロフ語音声の文字起こし
ウォロフ語の音声内容をテキストに変換します。
検証セットのCER 4.81%、WER 16.25%
言語技術開発
アフリカ言語技術の研究
アフリカの低リソース言語の音声技術研究の基礎を提供します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase