W

Wav2vec2 Large English

Developed by jonatasgrosman
facebook/wav2vec2-largeを英語用に微調整した自動音声認識モデル、Common Voice 6.1データセットでトレーニング
Downloads 355
Release Time : 3/2/2022

Model Overview

英語音声認識タスク向けに最適化されたwav2vec2大型モデル、16kHzサンプリングレートの音声入力をサポート

Model Features

高性能英語認識
Common Voice英語テストセットで21.53% WERと9.66% CERを達成
大型事前学習モデルベース
facebook/wav2vec2-largeモデルを微調整、強力な音声特徴抽出能力を有する
16kHzサンプリングレートサポート
16kHzサンプリングレートの音声入力に最適化

Model Capabilities

英語音声認識
音声からテキストへの変換
自動音声転写

Use Cases

音声転写
会議議事録自動転写
英語会議録音を自動的に文字記録に変換
約80%の精度(WER指標ベース)
ポッドキャストコンテンツ転写
英語ポッドキャスト番組を自動的にテキストコンテンツに変換
音声アシスタント
英語音声コマンド認識
スマートデバイス向け英語音声コマンド認識システム
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase