B

Bp Tedx100 Xlsr

lgrisによって開発
TEDxポルトガル語データセットでファインチューニングされたブラジルポルトガル語Wav2vec 2.0音声認識モデル
ダウンロード数 23
リリース時間 : 3/2/2022

モデル概要

このモデルはWav2vec 2.0アーキテクチャを使用し、TEDxポルトガル語多言語データセットでファインチューニングされ、ブラジルポルトガル語の自動音声認識タスク専用に設計されています。

モデル特徴

マルチデータセットトレーニング
モデルはCETUC、Common Voiceなど複数のポルトガル語音声データセットで評価されています
言語モデルサポート
4-gram言語モデルと組み合わせることで認識精度をさらに向上可能
高性能
複数のテストセットで優れた性能を発揮し、平均単語誤り率(WER)は0.321

モデル能力

ブラジルポルトガル語音声認識
音声からテキストへの変換
複数音声フォーマット処理対応

使用事例

音声文字起こし
講演内容の文字起こし
TEDxポルトガル語講演内容を自動的にテキストに変換
単語誤り率0.222
ビジネス音声文字起こし
ビジネス会議の録音を文字に変換
LaPS BMデータセットで単語誤り率0.169
音声分析
音声内容分析
ポルトガル語音声内容のテキスト分析
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase