W

Wav2vec2 Large Xls R 300m Br D2

DrishtiSharmaによって開発
facebook/wav2vec2-xls-r-300mをベースに、ブルトン語(Common Voice 8.0)で微調整した音声認識モデル
ダウンロード数 21
リリース時間 : 3/2/2022

モデル概要

これはブルトン語に最適化された自動音声認識(ASR)モデルで、wav2vec 2.0アーキテクチャの大規模XLS - Rバリエーションに基づき、Common Voice 8.0のブルトン語データセットで微調整されています。

モデル特徴

多言語事前学習の基礎
XLS - R - 300M多言語事前学習モデルに基づき、強力な言語間移行能力を持っています。
ブルトン語最適化
ブルトン語に特化して微調整され、Common VoiceテストセットでWERが0.4977に達します。
効率的な学習
混合精度学習や勾配累積などの技術を使用して学習効率を最適化しています。

モデル能力

ブルトン語音声認識
音声をテキストに変換

使用事例

音声文字起こし
ブルトン語音声文字起こし
ブルトン語の音声内容をテキストに変換
テストWER 0.4977、CER 0.1809
言語保護
少数民族言語のデジタル化
ブルトン語などの少数民族言語の保護とデジタル化を支援します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase