W

Wav2vec2 Gpt2 Wandb Grid Search

sanchit-gandhiによって開発
LibriSpeechデータセットに基づいて訓練された自動音声認識(ASR)モデル
ダウンロード数 13
リリース時間 : 3/2/2022

モデル概要

このモデルはLibriSpeechデータセットからスクラッチで訓練された自動音声認識システムで、英語音声をテキストに変換するために使用されます

モデル特徴

LibriSpeechデータセット訓練
大規模な公開英語音声データセットに基づいて訓練されており、優れた汎用性を備えています
自動音声認識
英語音声を正確にテキストに変換することが可能
最適化された訓練パラメータ
Adamオプティマイザーと線形学習率スケジューラーを使用して効率的に訓練

モデル能力

英語音声認識
音声テキスト変換

使用事例

音声文字起こし
音声文字起こし
英語音声コンテンツを編集可能なテキスト形式に変換
支援ツール
字幕生成
英語動画コンテンツに自動的に字幕を生成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase