X

Xlsr Wav2vec English

harshit345によって開発
facebook/wav2vec2-largeを汎用音声データセットで英語にファインチューニングした自動音声認識モデルで、16kHzサンプリングレートの音声入力をサポートします。
ダウンロード数 27
リリース時間 : 3/2/2022

モデル概要

これは英語の自動音声認識(ASR)用のWav2Vec2モデルで、追加の言語モデルなしで直接使用できるようにファインチューニングされています。

モデル特徴

高精度認識
汎用音声英語テストセットで21.53%の単語誤り率と9.66%の文字誤り率を達成
言語モデル不要
追加の言語モデルサポートなしで直接使用可能
16kHzサンプリングレート対応
16kHzサンプリングレートの音声入力に最適化

モデル能力

英語音声認識
音声文字起こし
自動音声テキスト変換

使用事例

音声文字起こし
会議議事録
会議録音を自動的に文字起こし
ポッドキャスト文字起こし
英語ポッドキャストコンテンツを自動的にテキスト化
支援技術
音声制御
アプリケーションに音声制御機能を追加
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase