W

Wav2vec2 Large Xls R 300m Guarani Small Wb

jhonparra18によって開発
このモデルはwav2vec2-large-xls-r-300mアーキテクチャに基づき、グアラニー語(Guarani)音声データセットで微調整された自動音声認識(ASR)モデルです。
ダウンロード数 16
リリース時間 : 4/25/2022

モデル概要

これはグアラニー語向けに最適化された音声認識モデルで、Facebookのwav2vec2-large-xls-r-300mアーキテクチャを基に、Common Voiceデータセットで微調整されています。

モデル特徴

低リソース言語サポート
グアラニー語のような低リソース言語向けに特別に最適化
効率的な微調整
事前訓練済みの大規模多言語モデルを基にしたターゲット微調整
良好な性能
評価セットで24.46%の単語誤り率と3.68%の文字誤り率を達成

モデル能力

音声からテキストへの変換
グアラニー語音声認識

使用事例

音声文字起こし
グアラニー語音声文字起こし
グアラニー語音声コンテンツをテキストに変換
単語誤り率24.46%、文字誤り率3.68%
言語保護
少数民族言語のデジタル化
グアラニー語などの少数民族言語の保存とデジタル化を支援
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase