W

Wav2vec2 Large Xlsr Nahuatl

tyoc213によって開発
facebook/wav2vec2-large-xlsr-53をファインチューニングしたナワトル語(ncj方言)音声認識モデル
ダウンロード数 18
リリース時間 : 3/2/2022

モデル概要

このモデルはメキシコ・プエブラ北部(ncj)のナワトル語向け自動音声認識モデルで、XLSR-53アーキテクチャをファインチューニングしており、直接音声からテキストへの変換機能をサポートしています

モデル特徴

多言語データ拡張
トレーニング時にCommon Voiceのスペイン語とドイツ語サンプルデータを組み合わせ、モデルの頑健性を強化しました
言語モデル不要
追加の言語モデルサポートなしで直接音声認識に使用可能
低リソース言語サポート
ナワトル語のような低リソース言語に特化して最適化されています

モデル能力

音声認識
ナワトル語音声からテキストへの変換
多方言適応

使用事例

言語保護
ナワトル語音声文字起こし
ナワトル語の口語コンテンツを文字に転写し、言語文書保存に利用
WER 69.11%
教育応用
言語学習支援
学習者がナワトル語の発音とリスニングを練習するのを支援
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase