W

Wav2vec2 2 Bert Large

Developed by speech-seq2seq
LibriSpeechデータセットでトレーニングされた自動音声認識(ASR)モデルで、英語音声をテキストに変換します
Downloads 17
Release Time : 3/2/2022

Model Overview

このモデルは英語音声に特化した自動音声認識システムで、音声信号を対応するテキスト内容に変換できます。

Model Features

高精度
LibriSpeech評価セットで1.9878の単語誤り率を達成
最適化トレーニング
Adamオプティマイザーと線形学習率スケジューラーを使用してトレーニング

Model Capabilities

英語音声認識
連続音声テキスト変換

Use Cases

音声文字起こし
音声文字変換
英語音声内容を自動的にテキスト形式に変換
単語誤り率1.9878
支援ツール
リアルタイム字幕生成
英語動画や会議にリアルタイム字幕を提供
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase