W

Wav2vec2 2 Bert Large No Adapter

speech-seq2seqによって開発
LibriSpeechデータセットで訓練された自動音声認識(ASR)モデルで、英語音声をテキストに変換します
ダウンロード数 15
リリース時間 : 3/2/2022

モデル概要

このモデルは英語音声に特化した自動音声認識システムで、音声信号を対応するテキスト内容に変換できます。

モデル特徴

高精度
LibriSpeech評価セットで1.7858の単語誤り率を達成
エンドツーエンド訓練
生音声データからテキスト出力までの完全なプロセスをエンドツーエンドで訓練
最適化訓練
Adamオプティマイザーと線形学習率スケジューラーを使用した精密調整

モデル能力

英語音声認識
連続音声テキスト変換
大規模音声データ処理

使用事例

音声文字起こし
オーディオブック文字起こし
オーディオブックの内容を自動的にテキスト形式に変換
精度98.2%以上を達成
会議議事録
リアルタイムまたは事後に会議録音を文字記録に変換
支援技術
聴覚支援
聴覚障害者向けにリアルタイム字幕サービスを提供
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase