X

Xlsr English

ashesicsis1によって開発
facebook/wav2vec2-xls-r-300mをlibrispeech_asrデータセットでファインチューニングした英語音声認識モデル
ダウンロード数 18
リリース時間 : 5/29/2022

モデル概要

このモデルは英語音声認識タスク向けに最適化されたXLS-Rアーキテクチャモデルで、LibriSpeechデータセットで低い単語誤り率を達成

モデル特徴

低単語誤り率
評価データセットで0.1451の単語誤り率を達成し、優れた性能を発揮
XLS-Rアーキテクチャ採用
facebookのwav2vec2-xls-r-300m事前学習モデルをベースに使用
精密なチューニング
30エポックのトレーニングと線形学習率スケジューリングによる最適化

モデル能力

英語音声認識
音声からテキストへの変換
大規模音声データ処理

使用事例

音声文字起こし
オーディオブック文字起こし
英語オーディオブックを自動的にテキストに変換
高精度な文字起こし結果
会議議事録
英語会議のテキスト記録を自動生成
支援技術
聴覚支援
聴覚障害者向けにリアルタイム音声テキスト変換サービスを提供
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase