E

Exp W2v2t En Vp Nl S281

Developed by jonatasgrosman
facebook/wav2vec2-large-nl-voxpopuliモデルを基に微調整した英語音声認識モデルで、Common Voice 7.0トレーニングセットを使用して学習されています。
Downloads 18
Release Time : 7/8/2022

Model Overview

このモデルは英語の自動音声認識(ASR)モデルで、英語音声をテキストに変換するタスクに適しています。

Model Features

高品質な事前学習モデルを基に
facebook/wav2vec2-large-nl-voxpopuliモデルを基に微調整されており、強力な音声特徴抽出能力を継承しています。
Common Voiceデータセットの使用
Mozilla Foundationが提供するCommon Voice 7.0データセットを使用して学習されており、データ品質が信頼できます。
16kHzサンプリングレート対応
16kHzサンプリングレートの音声入力を処理するために特別に最適化されています。

Model Capabilities

英語音声認識
音声からテキストへの変換

Use Cases

音声文字起こし
会議議事録
英語の会議録音を自動的に文字記録に変換
字幕生成
英語の動画コンテンツに自動的に字幕を生成
音声アシスタント
音声コマンド認識
英語音声アシスタントシステムでの音声コマンド認識に使用
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase