W

Wav2vec2 Xls R 1b English

jonatasgrosmanによって開発
これはXLS - R 1Bアーキテクチャに基づく英語音声認識モデルで、複数の英語音声データセットで微調整されています。
ダウンロード数 1,896
リリース時間 : 3/2/2022

モデル概要

このモデルは英語音声認識タスクに最適化されており、英語の音声をテキストに変換することができます。

モデル特徴

複数データセットによる訓練
Common Voice 8.0、Multilingual LibriSpeech、TED - LIUMv3、Voxpopuliなどの複数のデータセットを使用して訓練されています。
高性能
Common Voice 8テストセットで21.05%のWERと8.44%のCERを達成しました。
言語モデルサポート
言語モデル(LM)と組み合わせて使用することができ、認識精度をさらに向上させます。

モデル能力

英語音声認識
リアルタイム音声テキスト変換
16kHzサンプリングレートの音声処理サポート

使用事例

音声文字起こし
会議記録
英語の会議録音を自動的に文字記録に変換します。
精度約80% (WER 20%)
ポッドキャスト文字起こし
英語のポッドキャスト内容を文字起こしに変換します。
支援技術
音声入力システム
障害者に音声入力ソリューションを提供します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase