W

Wav2vec2 Large Xlsr Open Brazilian Portuguese V2

lgrisによって開発
これはブラジルポルトガル語に最適化されたWav2vec2モデルで、複数のオープンデータセットでトレーニングされ、自動音声認識タスクに使用されます。
ダウンロード数 1,825
リリース時間 : 3/2/2022

モデル概要

このモデルはWav2vec2アーキテクチャに基づく自動音声認識(ASR)モデルで、特にブラジルポルトガル語用にファインチューニングされています。複数の公開可能なブラジルポルトガル語音声データセットを統合しており、ポルトガル語音声をテキストに変換できます。

モデル特徴

マルチデータセットトレーニング
CETUC、MLS、VoxForge、Common Voice、Lapsbmなどの複数のブラジルポルトガル語データセットを統合し、モデルの汎化能力を向上させました
高性能
Common Voiceテストセットで10.69%の単語誤り率(WER)を達成
オープンライセンス
Apache 2.0ライセンスで公開されており、商業利用や研究利用が可能

モデル能力

ブラジルポルトガル語音声認識
音声テキスト変換
複数のオーディオサンプルレートに対応

使用事例

音声文字起こし
会議議事録
ブラジルポルトガル語の会議録音を自動的に文字起こし
公式な場面の音声で良好な性能を発揮
字幕生成
ブラジルポルトガル語の動画コンテンツに自動的に字幕を生成
クリアな音声では高い精度を達成
音声アシスタント
ポルトガル語音声コマンド認識
ブラジルポルトガル語音声アシスタントの基礎音声認識コンポーネントとして使用
コマンドや制御シナリオに適している
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase