B

Bp500 Base10k Voxpopuli

Developed by lgris
これはブラジルポルトガル語に最適化されたWav2vec 2.0音声認識モデルで、複数のブラジルポルトガル語データセットでファインチューニングされています
Downloads 23
Release Time : 3/2/2022

Model Overview

このモデルはWav2vec 2.0アーキテクチャに基づく自動音声認識(ASR)システムで、ブラジルポルトガル語に特化して最適化されており、複数のブラジルポルトガル語データセットで優れた性能を発揮します

Model Features

複数データセットトレーニング
CETUC、Common Voice、LaPS BMなど複数のブラジルポルトガル語データセットを統合し、合計450時間以上のトレーニングデータを使用しています
言語モデルサポート
4-gram言語モデルと組み合わせることで認識精度をさらに向上できます
広範なテスト検証
7つの異なるテストセットで包括的な評価を行い、平均WERは18.1%でした

Model Capabilities

ブラジルポルトガル語音声認識
音声からテキストへの変換
16kHzサンプリングレートの音声処理に対応

Use Cases

音声文字起こし
ブラジルポルトガル語音声文字起こし
ブラジルポルトガル語の音声をテキストに変換します
CETUCテストセットではWERが12.0%で、言語モデルと組み合わせると7.5%まで低下します
音声アシスタント
ブラジルポルトガル語音声コマンド認識
ブラジルポルトガル語の音声アシスタントやスマートホームデバイスの音声コマンド認識に使用できます
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase