W

Wav2vec2 Xls R 300m Ca

PereLluis13によって開発
facebook/wav2vec2-xls-r-300mをカタルーニャ語データセットでファインチューニングした音声認識モデルで、自動音声認識タスクをサポートします。
ダウンロード数 116
リリース時間 : 3/2/2022

モデル概要

このモデルはカタルーニャ語の自動音声認識(ASR)モデルで、複数のカタルーニャ語データセットでファインチューニングされ、音声をテキストに変換できます。

モデル特徴

多データセット訓練
MOZILLA - FOUNDATION/COMMON_VOICE_8_0、tv3_parla、parlament_parlaなどの複数のカタルーニャ語データセットでファインチューニングされました。
数字変換サポート
特殊な処理を使用して数字を文字形式に変換し、数字認識の正確性を向上させます。
最適化された訓練プロセス
精心設計された前処理プロセスと訓練ハイパーパラメータを採用し、線形学習率スケジューリングとAMP混合精度訓練を含みます。

モデル能力

カタルーニャ語音声認識
音声をテキストに変換
数字認識

使用事例

メディア文字起こし
テレビ番組字幕生成
カタルーニャ語のテレビ番組に自動で字幕を生成します。
tv3_parlaデータセットでのWERは23.32%です。
会議記録
議会会議記録
カタルーニャ議会の会議内容を自動で文字起こしします。
parlament_parlaデータセットでのWERは8.05%です。
音声アシスタント
カタルーニャ語音声入力
カタルーニャ語の音声アシスタントに音声認識機能を提供します。
Common VoiceデータセットでのWERは13.17%です。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase