B

Bp500 Xlsr

lgrisによって開発
これはブラジルポルトガル語に対して微調整されたWav2vec 2.0モデルで、複数のブラジルポルトガル語データセットを使用して訓練され、Common VoiceテストセットでのWERは13.6です。
ダウンロード数 21
リリース時間 : 3/2/2022

モデル概要

このモデルはWav2vec 2.0アーキテクチャに基づく自動音声認識(ASR)モデルで、ブラジルポルトガル語に特化して最適化されています。CETUC、Common Voice、LaPS BMなど複数のブラジルポルトガル語データセットを統合し、総訓練データ量は400時間を超えています。

モデル特徴

複数データセットによる訓練
7つの異なるブラジルポルトガル語データセットを統合し、総訓練時間は400時間を超えています
言語モデルのサポート
4-gram言語モデルとの組み合わせ使用をサポートし、認識精度をさらに向上させることができます
低WER
複数のテストセットで優れた性能を発揮し、平均WERは10.8%です

モデル能力

ブラジルポルトガル語音声認識
複数のオーディオサンプリングレートをサポート
言語モデルを組み合わせて性能を向上させることができる

使用事例

音声文字変換
音声文字起こし
ブラジルポルトガル語の音声内容を文字に変換する
Common VoiceテストセットでのWERは13.6%です
音声アシスタント
ブラジルポルトガル語音声指令認識
ブラジルポルトガル語音声アシスタントのフロントエンド音声認識に使用する
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase