W

Wav2vec2 Large Xls R 300m Myv V1

DrishtiSharmaによって開発
これはfacebook/wav2vec2-xls-r-300mをベースに、MOZILLA-FOUNDATION/COMMON_VOICE_8_0 - MYVデータセットで微調整されたエルザ語(Erzya)の音声認識モデルです。
ダウンロード数 27
リリース時間 : 3/2/2022

モデル概要

このモデルはエルザ語に対する自動音声認識(ASR)モデルで、Common Voice 8データセットで微調整トレーニングされています。

モデル特徴

多言語対応
XLS - Rアーキテクチャに基づき、言語をまたいだ音声認識をサポートします
効率的な微調整
Common Voice 8のエルザ語データセットで最適化されています
ロバストな性能
テストセットでCER 0.13とWER 0.6の性能を達成しました

モデル能力

エルザ語音声認識
自動音声からテキストへの変換
言語をまたいだ音声処理

使用事例

音声技術
エルザ語音声アシスタント
エルザ語のユーザー向けに音声対話アプリを開発する
音声文字起こしサービス
エルザ語の音声内容をテキストに変換する
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase