W

Wav2vec2 Large Xls R 300m Guarani Small

jhonparra18によって開発
このモデルはfacebook/wav2vec2-xls-r-300mを汎用音声データセットでファインチューニングしたバージョンで、グアラニー語音声認識をサポートしています。
ダウンロード数 20
リリース時間 : 3/2/2022

モデル概要

これはグアラニー語に最適化された音声認識モデルで、wav2vec2アーキテクチャに基づき、汎用音声データセットでファインチューニングされています。

モデル特徴

多言語サポート
XLS-Rアーキテクチャに基づき、言語横断的な転移学習能力を有する
効率的なファインチューニング
汎用音声データセットでターゲットを絞ったファインチューニングを実施
ロバストな性能
評価データセットで0.5957の単語誤り率を達成

モデル能力

音声テキスト変換
グアラニー語認識
自動音声認識

使用事例

音声文字起こし
グアラニー語音声文字起こし
グアラニー語音声をテキストに変換
単語誤り率0.5957
言語学習
グアラニー語学習支援
学習者の発音精度検証を支援
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase