W

Wav2vec2 Large Xls R 300m Pt Cv

lgrisによって開発
facebook/wav2vec2-xls-r-300mをベースに、Common Voiceポルトガル語データセットで微調整した自動音声認識モデル
ダウンロード数 22
リリース時間 : 3/2/2022

モデル概要

このモデルは、ポルトガル語の自動音声認識(ASR)タスクに最適化されたwav2vec2モデルで、Common Voiceデータセットで微調整され、ポルトガル語の音声をテキストに変換できます。

モデル特徴

ポルトガル語最適化
ポルトガル語の音声認識に特化して最適化と微調整が行われました
大規模事前学習モデルをベース
facebook/wav2vec2-xls-r-300mモデルをベースに微調整され、その強力な音声特徴抽出能力を引き継いでいます
複数データセットでの評価
Common Voiceとロバスト音声イベントなどの複数のデータセットで評価されました

モデル能力

ポルトガル語音声認識
音声をテキストに変換

使用事例

音声文字起こし
ポルトガル語音声文字起こし
ポルトガル語の音声内容をテキストに変換
Common VoiceテストセットでのWERは24.29%
音声アシスタント
ポルトガル語音声コマンド認識
ポルトガル語の音声アシスタントシステムでの音声コマンド認識に使用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase