B

Bp500 Base10k Voxpopuli

lgrisによって開発
これはブラジルポルトガル語に最適化されたWav2vec 2.0音声認識モデルで、複数のブラジルポルトガル語データセットでファインチューニングされています
ダウンロード数 23
リリース時間 : 3/2/2022

モデル概要

このモデルはWav2vec 2.0アーキテクチャに基づく自動音声認識(ASR)システムで、ブラジルポルトガル語に特化して最適化されており、複数のブラジルポルトガル語データセットで優れた性能を発揮します

モデル特徴

複数データセットトレーニング
CETUC、Common Voice、LaPS BMなど複数のブラジルポルトガル語データセットを統合し、合計450時間以上のトレーニングデータを使用しています
言語モデルサポート
4-gram言語モデルと組み合わせることで認識精度をさらに向上できます
広範なテスト検証
7つの異なるテストセットで包括的な評価を行い、平均WERは18.1%でした

モデル能力

ブラジルポルトガル語音声認識
音声からテキストへの変換
16kHzサンプリングレートの音声処理に対応

使用事例

音声文字起こし
ブラジルポルトガル語音声文字起こし
ブラジルポルトガル語の音声をテキストに変換します
CETUCテストセットではWERが12.0%で、言語モデルと組み合わせると7.5%まで低下します
音声アシスタント
ブラジルポルトガル語音声コマンド認識
ブラジルポルトガル語の音声アシスタントやスマートホームデバイスの音声コマンド認識に使用できます
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase