W

Wav2vec2 Large XLSR 53 Portuguese

Rubensによって開発
Facebookのwav2vec2-large-xlsr-53モデルを基に、公共音声データセットのポルトガル語データでファインチューニングした音声認識モデル
ダウンロード数 20
リリース時間 : 3/2/2022

モデル概要

これはポルトガル語に最適化された自動音声認識(ASR)モデルで、Facebookのwav2vec2-large-xlsr-53アーキテクチャをファインチューニングしており、ポルトガル語の音声からテキストへの変換タスクに適しています。

モデル特徴

ポルトガル語最適化
ポルトガル語音声データに特化してファインチューニングされており、ポルトガル語の認識精度が向上しています
言語モデル不要
追加の言語モデルなしで直接使用可能
高性能
公共音声データセットのポルトガル語テストセットで20.41%の単語誤り率(WER)を達成

モデル能力

ポルトガル語音声認識
音声からテキストへの変換
自動音声処理

使用事例

音声文字起こし
ポルトガル語音声からテキストへ
ポルトガル語の音声コンテンツをテキスト形式に変換
単語誤り率20.41%
音声アシスタント
ポルトガル語音声インタラクション
ポルトガル語音声アシスタントに音声認識能力を提供
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase