W

Wav2vec2 Large Xlsr Portuguese

joaoalvarengaによって開発
Facebookのwav2vec2-large-xlsr-53アーキテクチャをベースに微調整されたポルトガル語自動音声認識モデルで、汎用音声データセットで学習され、単語誤り率は13.77%です。
ダウンロード数 83
リリース時間 : 3/2/2022

モデル概要

これはポルトガル語に特化して最適化された自動音声認識(ASR)モデルで、大規模自己教師付き事前学習のwav2vec2アーキテクチャに基づいており、ポルトガル語の音声をテキストに変換するタスクに適しています。

モデル特徴

高精度なポルトガル語認識
汎用音声ポルトガル語テストセットで13.77%の単語誤り率を達成し、優れた性能を発揮します。
XLSRアーキテクチャに基づく
多言語音声表現の大規模事前学習モデルを利用し、強力な音声特徴抽出能力を持っています。
言語モデル不要
直接使用でき、追加の言語モデルなしで音声をテキストに変換する機能を実現できます。
オープンソースライセンス
Apache-2.0ライセンスを採用しており、商用および研究用途が許可されています。

モデル能力

ポルトガル語音声認識
音声をテキストに変換
音声文字起こし

使用事例

音声文字起こし
ポルトガル語会議記録
ポルトガル語の会議録音を自動的に文字記録に変換します
精度約86.23%
音声アシスタント
ポルトガル語の音声アシスタントに音声認識機能を提供します
教育
言語学習アプリ
学習者がポルトガル語の発音と聴解を練習するのを支援します
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase