W

Wav2vec2 Large Xlsr 53 Portuguese

Developed by facebook
Facebookが開発したWav2Vec 2.0アーキテクチャに基づく大規模ポルトガル語自動音声認識(ASR)モデルで、ポルトガル語音声からテキストへの変換タスクをサポートします。
Downloads 425
Release Time : 3/2/2022

Model Overview

このモデルはWav2Vec 2.0アーキテクチャでトレーニングされた大規模なクロスランゲージ音声表現モデル(XLSR)で、特にポルトガル語向けに最適化されており、ポルトガル語音声を正確にテキストに変換できます。

Model Features

クロスランゲージ音声表現
XLSR-53アーキテクチャに基づき、言語を超えた共通の音声特徴表現を学習可能
ポルトガル語最適化
特にポルトガル語の音声特性に合わせて最適化されたトレーニングを実施
エンドツーエンド認識
中間特徴抽出ステップなしで、生の音声入力から直接テキスト出力を生成

Model Capabilities

ポルトガル語音声認識
音声からテキストへの変換
自動音声書き起こし

Use Cases

音声書き起こし
ポルトガル語音声から文字へ
ポルトガル語の音声内容を自動的に編集可能なテキスト形式に変換
Common Voiceポルトガル語テストセットでWER27.1%を達成
音声アシスタント
ポルトガル語音声コマンド認識
ポルトガル語音声アシスタントや音声制御アプリケーションの構築に使用
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase