W

Wav2vec2 Base Vios Commonvoice 1

tclongによって開発
このモデルはfacebook/wav2vec2-xls-r-300mをCommon Voiceデータセットでファインチューニングした音声認識モデルで、自動音声認識タスクをサポートします。
ダウンロード数 21
リリース時間 : 6/10/2022

モデル概要

これはwav2vec2アーキテクチャに基づく音声認識モデルで、ファインチューニング後に音声をテキストに変換するために使用できます。

モデル特徴

wav2vec2アーキテクチャベース
先進的なwav2vec2アーキテクチャを採用し、高品質な音声認識能力を提供
ファインチューニング最適化
Common Voiceデータセットでファインチューニングを行い、認識性能を最適化
低い単語誤り率
評価データセットで0.3621の単語誤り率(WER)を達成

モデル能力

音声認識
音声からテキストへの変換

使用事例

音声文字起こし
音声からテキストへのサービス
音声内容を文字記録に変換
単語誤り率0.3621
支援技術
リアルタイム字幕生成
動画やライブコンテンツのためのリアルタイム字幕生成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase