W

Wav2vec2 Base Toy Train Data Random Noise 0.1

scasuttによって開発
facebook/wav2vec2-baseモデルをランダムノイズデータセットでファインチューニングした音声認識モデル
ダウンロード数 22
リリース時間 : 3/26/2022

モデル概要

このモデルはwav2vec2-baseのファインチューニング版で、主に音声認識タスク向けに、ランダムノイズを追加したデータセットでトレーニングされています。

モデル特徴

ノイズ耐性
ランダムノイズを追加したデータセットでトレーニングされており、ある程度のノイズ耐性を持っています
wav2vec2アーキテクチャベース
Facebookのwav2vec2-baseアーキテクチャを採用しており、優れた音声特徴抽出能力を持っています

モデル能力

音声認識
ノイズ環境下での音声処理

使用事例

音声認識
ノイズ環境下での音声転写
一定の背景ノイズがある環境で音声を認識・転写する
単語誤り率(WER)は0.7213
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase