L

Librispeech 100h Supervised

Kuray107によって開発
このモデルは、facebook/wav2vec2-large-lv60をベースに、LibriSpeechの100時間データセットで微調整された音声認識モデルで、低い単語誤り率を達成しています。
ダウンロード数 14
リリース時間 : 3/2/2022

モデル概要

これは英語の音声認識に使用される教師あり学習モデルで、wav2vec2アーキテクチャに基づき、LibriSpeechの100時間データセットで微調整されています。

モデル特徴

低い単語誤り率
評価セットで0.0345の単語誤り率(WER)を達成し、優れた性能を示しました。
wav2vec2アーキテクチャに基づく
facebook/wav2vec2-large-lv60をベースモデルとして採用し、強力な音声特徴抽出能力を持っています。
教師あり学習による微調整
LibriSpeechの100時間データセットで教師あり学習による微調整を行い、音声認識性能を最適化しました。

モデル能力

英語音声認識
音声をテキストに変換

使用事例

音声文字起こし
会議記録
会議の録音を自動的に文字起こしします。
精度は96.55%に達します。
字幕生成
動画コンテンツに自動的に英語字幕を生成します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase