B

Bp400 Xlsr

lgrisによって開発
ブラジルポルトガル語データセットを用いて微調整されたWav2vec 2.0音声認識モデルで、ブラジルポルトガル語の自動音声認識タスクをサポートします。
ダウンロード数 55
リリース時間 : 3/2/2022

モデル概要

このモデルは、ブラジルポルトガル語向けに最適化された自動音声認識(ASR)システムで、Wav2vec 2.0アーキテクチャに基づき、複数のブラジルポルトガル語データセットで微調整されています。

モデル特徴

複数データセットによる訓練
モデルは7つのブラジルポルトガル語データセット(CETUC、Common Voiceなど)を統合し、合計400時間以上の訓練データを使用しています。
言語モデルのサポート
4-gram言語モデルを組み合わせることで、認識精度をさらに向上させることができ、平均WERが12.4%から10.5%に低下します。
高い精度
複数のテストセットで優れた性能を発揮し、CETUCテストセットではWERが3.0%まで低下し、Common VoiceテストセットではWERが9.6%です。

モデル能力

ブラジルポルトガル語音声認識
音声文字起こし
音声をテキストに変換

使用事例

音声文字起こし
ブラジルポルトガル語音声文字起こし
ブラジルポルトガル語の音声内容をテキストに変換します。
CETUCデータセットで3.0%のWERという高い精度を達成しました。
音声アシスタント
ブラジルポルトガル語音声指令認識
ブラジルポルトガル語の音声アシスタントシステムにおける指令認識に使用されます。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase