W

Wav2vec2 Base Toy Train Data Augment 0.1.csv

scasuttによって開発
このモデルはfacebook/wav2vec2-baseをベースに微調整された音声認識モデルで、データ拡張技術(拡張率0.1)を使用しています。
ダウンロード数 21
リリース時間 : 3/25/2022

モデル概要

これは小さなトイデータセットで微調整された音声認識モデルで、主に実験やデモンストレーション目的で使用されます。

モデル特徴

データ拡張
トレーニングプロセスで10%のデータ拡張率を使用しており、モデルの汎化能力を向上させた可能性があります
軽量な微調整
事前トレーニング済みのwav2vec2-baseモデルをベースに微調整されており、小さなデータセットに適しています

モデル能力

音声認識
音響特徴抽出

使用事例

音声処理
小規模音声認識実験
音声認識技術の教育デモンストレーションや小規模実験に使用可能
単語誤り率(WER)は0.9997
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase