W

Wav2vec2 2 Gpt2 Regularisation

sanchit-gandhiによって開発
これはLibriSpeechデータセットで訓練された自動音声認識(ASR)モデルで、英語音声をテキストに変換できます。
ダウンロード数 20
リリース時間 : 3/17/2022

モデル概要

このモデルはLibriSpeech ASRデータセットで一から訓練された自動音声認識モデルで、主に英語音声からテキストへの変換タスクに使用されます。

モデル特徴

高精度
LibriSpeech評価セットで低い単語誤り率(WER)を達成
エンドツーエンド訓練
モデルは一から訓練されており、事前訓練モデルに依存しない
最適化訓練
Adamオプティマイザーと線形学習率スケジューラーを使用して訓練

モデル能力

英語音声認識
連続音声からテキストへの変換
大規模音声データ処理

使用事例

音声文字起こし
オーディオブック文字起こし
英語オーディオブックを自動的にテキストに変換
単語誤り率は約0.9977
会議議事録
英語会議内容を自動記録
音声アシスタント
音声コマンド認識
英語音声コマンドを認識
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase