V

Victor Hg Ptbr 2.0

Vktによって開発
common_voiceデータセットでfacebook/wav2vec2-xls-r-300mをファインチューニングしたポルトガル語音声認識モデル
ダウンロード数 30
リリース時間 : 5/24/2022

モデル概要

これはポルトガル語に最適化された自動音声認識(ASR)モデルで、XLS-Rアーキテクチャを基にファインチューニングされており、ブラジルポルトガル語の音声テキスト変換タスクに適しています。

モデル特徴

高精度
評価セットで2.19%の単語誤り率(WER)を達成し、優れた性能を発揮
大規模事前学習ベース
facebook/wav2vec2-xls-r-300mモデルを基にファインチューニングされており、強力な音声特徴抽出能力を継承
ブラジルポルトガル語最適化
特にブラジルポルトガル語向けにファインチューニングされ、地域の言語特性に適応

モデル能力

ブラジルポルトガル語音声認識
音声テキスト変換
音声文字起こし

使用事例

音声文字起こし
会議議録自動化
ポルトガル語の会議録音を自動的に文字記録に変換
高精度な文字起こしテキスト
音声アシスタント
ブラジル市場向けポルトガル語音声アシスタントの構築
正確な音声コマンド認識
アクセシビリティ技術
リアルタイム字幕生成
ポルトガル語動画コンテンツ向けリアルタイム字幕生成
コンテンツのアクセシビリティ向上
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase