A

Asr Wav2vec2 Dvoice Darija

speechbrainによって開発
これはモロッコアラビア語方言(Darija)に対する自動音声認識モデルで、wav2vec 2.0アーキテクチャに基づき、DVoiceデータセットで微調整して訓練されたものです。
ダウンロード数 120
リリース時間 : 6/9/2022

モデル概要

このモデルはエンドツーエンドのDarija音声文字起こし機能を提供し、事前学習されたwav2vec 2.0モデルを基礎として、DNN層を追加してDarijaデータセットで微調整し、最終的にCTC貪欲デコーダーによりテキスト結果を出力します。

モデル特徴

低リソース言語サポート
リソースが少ないDarija方言に特化して最適化されており、転移学習技術によりデータ不足の問題を解決します。
コミュニティ主導のデータ
DVoiceプラットフォームで収集された実際のコミュニティの録音データに基づいて訓練されており、実際の言語使用シーンを反映しています。
効率的な微調整アーキテクチャ
事前学習されたwav2vec2-large-xlsr-53モデルに、たった2層のDNNを追加して微調整することで、効率的な訓練を実現します。

モデル能力

モロッコアラビア語方言音声認識
16kHzモノラルオーディオ処理
自動オーディオ標準化(リサンプリング/モノラル選択)

使用事例

音声文字起こし
方言メディアコンテンツの文字起こし
モロッコ方言のポッドキャスト、ビデオなどのコンテンツを自動的に文字に変換します。
テストセットWER 18.28%、CER 5.85%
音声アシスタント
方言音声指令認識
モロッコ地域のユーザーに方言での対話ができる音声アシスタントを提供します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase