M

Model Facebookptbrlarge

Vktによって開発
Facebookのwav2vec2-large-xlsr-53-portugueseモデルをcommon_voiceデータセットでファインチューニングしたブラジルポルトガル語音声認識モデル
ダウンロード数 22
リリース時間 : 6/7/2022

モデル概要

このモデルはブラジルポルトガル語に最適化された自動音声認識(ASR)モデルで、common_voiceデータセットでファインチューニングされており、低い単語誤り率を達成しています

モデル特徴

高精度音声認識
common_voice評価セットで13.22%の単語誤り率(WER)を達成
ブラジルポルトガル語最適化
ブラジルポルトガル語の音声特性に特化してファインチューニング
wav2vec2アーキテクチャ採用
Facebookの先進的なwav2vec2-large-xlsr-53アーキテクチャを採用

モデル能力

ブラジルポルトガル語音声からテキストへの変換
連続音声認識
音声コンテンツの文字起こし

使用事例

音声文字起こし
音声メモの文字起こし
ブラジルポルトガル語の音声メモをテキストに変換
高精度な文字起こし結果
カスタマーサポート会話記録
ブラジルポルトガル語のカスタマーサポート会話を自動記録
手作業による文字起こしコストの削減
支援技術
音声入力システム
ブラジルポルトガル語ユーザー向け音声入力機能を提供
アクセシビリティ体験の向上
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase