W

Wav2vec2 Large Xlsr Open Brazilian Portuguese

lgrisによって開発
これはブラジルポルトガル語に対して微調整されたWav2vec 2.0モデルで、Common Voice、MLS、CETUCなどの複数のオープンブラジルポルトガル語データセットを使用して訓練されています。
ダウンロード数 395
リリース時間 : 3/2/2022

モデル概要

このモデルは自動音声認識(ASR)モデルで、ブラジルポルトガル語に特化して最適化されており、ポルトガル語の音声をテキストに変換することができます。

モデル特徴

複数データセットによる訓練
複数のブラジルポルトガル語データセット(CETUC、MLS、VoxForge、Common Voice、Lapsbm)を組み合わせて訓練することで、モデルの汎化能力を向上させました。
高性能
Common Voiceテストセットで12.9%の単語誤り率(WER)を達成し、優れた性能を発揮しました。
オープンデータ
完全にオープンデータセットを基に訓練されているため、モデルの透明性と再現性が保証されています。

モデル能力

ブラジルポルトガル語音声認識
長時間音声処理
複数のアクセントへの適応

使用事例

音声からテキストへの変換
音声文字起こし
ブラジルポルトガル語の音声内容を文字記録に変換する
標準テストセットで12.9%の単語誤り率を達成
支援技術
音声制御アプリケーション
ブラジルポルトガル語のユーザーに音声制御インターフェースを提供する
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase