W

Wav2vec2 Base Toy Train Data Masked Audio 10ms

scasuttによって開発
facebook/wav2vec2-baseを微調整した音声認識モデルで、10ms音声マスキングタスクでトレーニング
ダウンロード数 22
リリース時間 : 3/26/2022

モデル概要

このモデルはwav2vec2-baseの微調整版で、マスク処理された音声データの処理に特化しており、音声認識タスクに適しています。

モデル特徴

10ms音声マスキング処理
10ms間隔のマスク音声データに特化して最適化されたトレーニング
wav2vec2-baseベースの微調整
成熟したwav2vec2-baseアーキテクチャを基にした最適化

モデル能力

音声認識
マスク音声処理

使用事例

音声処理
不完全な音声認識
マスクされたり欠損した音声内容の認識
WER 0.7145
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase