W

Wav2vec2 Base Pt Voxpopuli V2

facebookによって開発
ポルトガル語のVoxPopuliコーパスを使って事前学習されたWav2Vec2の基礎モデルで、音声認識タスクに適しています。
ダウンロード数 30
リリース時間 : 3/2/2022

モデル概要

これはFacebookのWav2Vec2アーキテクチャに基づく音声処理の基礎モデルで、ポルトガル語に特化して事前学習されており、音声認識などのタスクに使用できます。

モデル特徴

ポルトガル語専用の事前学習
ポルトガル語の音声データに特化して事前学習され、ポルトガル語の認識精度が最適化されています。
VoxPopuliコーパスに基づく
VoxPopuliコーパスの17.5kの未ラベル付きポルトガル語データを使って学習されています。
16kHzオーディオ対応
モデルの事前学習と推論はどちらも16kHzのサンプリングレートの音声オーディオをサポートしています。

モデル能力

ポルトガル語音声認識
音声特徴抽出

使用事例

音声技術
ポルトガル語音声を文字に変換
ポルトガル語の音声を文字内容に変換します。
最適な結果を得るには微調整が必要です。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase