W

Wav2vec2 Base Toy Train Data Random Noise

scasuttによって開発
このモデルはfacebook/wav2vec2-baseを玩具訓練データで微調整した音声認識モデルで、主にランダムノイズ環境下での音声認識タスクを処理するために使用されます。
ダウンロード数 22
リリース時間 : 3/27/2022

モデル概要

これは微調整されたwav2vec2-baseモデルで、ランダムノイズ環境下での音声認識に特化しています。モデルは評価セットで0.7351の単語誤り率を達成しました。

モデル特徴

ノイズ環境適応
ランダムノイズ環境向けに最適化され、騒がしい条件下での音声認識精度を向上させました
wav2vec2アーキテクチャベース
強力なwav2vec2-baseモデルを基盤として構築され、優れた音声特徴抽出能力を継承しています

モデル能力

音声認識
ノイズ環境下での音声処理

使用事例

音声文字起こし
騒がしい環境下での音声文字起こし
ランダムノイズを含む音声をテキストに変換
単語誤り率0.7351
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase