B

Bp Sid10 Xlsr

lgrisによって開発
これはブラジルポルトガル語向けにファインチューニングされたWav2vec 2.0モデルで、Sidneyデータセットを使用してトレーニングされ、ブラジルポルトガル語の自動音声認識タスクに適しています。
ダウンロード数 21
リリース時間 : 3/2/2022

モデル概要

このモデルはWav2vec 2.0アーキテクチャに基づく自動音声認識(ASR)モデルで、特にブラジルポルトガル語向けにファインチューニングされています。ポルトガル語音声をテキストに変換でき、複数のブラジルポルトガル語データセットでテストされています。

モデル特徴

ブラジルポルトガル語最適化
特にブラジルポルトガル語向けにファインチューニングされており、複数のブラジルポルトガル語データセットで良好なパフォーマンスを発揮
複数データセット検証
CETUC、Common Voice、LaPS BMなどの複数のブラジルポルトガル語データセットでテスト済み
言語モデル統合サポート
4-gram言語モデルと組み合わせて使用可能で、認識精度を大幅に向上

モデル能力

ブラジルポルトガル語音声認識
音声からテキストへの変換
複数オーディオフォーマット処理サポート

使用事例

音声文字起こし
ブラジルポルトガル語音声文字起こし
ブラジルポルトガル語音声コンテンツをテキストに変換
SIDデータセットでの単語誤り率(WER)は0.124で、言語モデルと組み合わせると0.101まで低下
音声アシスタント
ブラジルポルトガル語音声アシスタント
ブラジル市場向け音声アシスタントアプリケーションの開発
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase