W

Wav2vec2 Large Xlsr Coraa Portuguese Cv8

lgrisによって開発
Edresson/wav2vec2-large-xlsr-coraa-portugueseをベースに、common_voiceデータセットで微調整したポルトガル語音声認識モデル
ダウンロード数 34
リリース時間 : 3/2/2022

モデル概要

このモデルはポルトガル語用に最適化された自動音声認識(ASR)モデルで、wav2vec2-large-xlsrアーキテクチャに基づき、Common Voice 8.0データセットで微調整されており、ポルトガル語の音声をテキストに変換できます。

モデル特徴

高い精度
評価セットで13.65%の単語誤り率(WER)を達成し、優れた性能を発揮します。
大規模事前学習に基づく
wav2vec2-large-xlsrアーキテクチャの事前学習モデルを基に微調整されています。
ポルトガル語に特化した最適化
Common Voiceポルトガル語データセットで特化して微調整されています。

モデル能力

ポルトガル語音声認識
音声からテキストへの変換

使用事例

音声文字起こし
音声メモの文字起こし
ポルトガル語の音声メモを検索可能なテキストに変換します。
精度約86.35%
障害者対応アプリ
リアルタイム字幕生成
ポルトガル語のビデオコンテンツにリアルタイム字幕を生成します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase