B

Bp Voxforge1 Xlsr

lgrisによって開発
これはブラジルポルトガル語音声認識タスク向けにファインチューニングされたWav2Vec2モデルで、VoxForgeデータセットでトレーニングされています。
ダウンロード数 21
リリース時間 : 3/2/2022

モデル概要

このモデルはFacebookのWav2Vec2アーキテクチャに基づいており、ブラジルポルトガル語音声認識タスク向けに特別にファインチューニングされています。ポルトガル語音声をテキストに変換でき、さまざまなブラジルポルトガル語方言に対応しています。

モデル特徴

マルチデータセット評価
モデルはCETUC、Common Voiceなど7つの異なるデータセットを含む複数のブラジルポルトガル語データセットで包括的に評価されています
言語モデル統合
4-gram言語モデルとの組み合わせ使用をサポートし、単語誤り率(WER)を大幅に低減します
軽量ソリューション
比較的小さなVoxForgeデータセット(3.9時間)でトレーニングされていますが、それでも良好な認識効果を達成できます

モデル能力

ブラジルポルトガル語音声認識
音声からテキストへ
複数のブラジル方言をサポート

使用事例

音声文字起こし
ブラジルポルトガル語音声文字起こし
ブラジルポルトガル語音声コンテンツをテキストに変換
平均単語誤り率0.584(言語モデルなし)または0.454(4-gram言語モデル使用)
音声アシスタント
ブラジルポルトガル語音声コマンド認識
ブラジルポルトガル語音声アシスタントの基本認識コンポーネントとして使用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase