W

Wav2vec2 Base Toy Train Data Augment 0.1

scasuttによって開発
facebook/wav2vec2-baseを微調整した音声認識モデルで、玩具データセットで訓練され、0.1の比率でデータ拡張が適用されています
ダウンロード数 22
リリース時間 : 3/25/2022

モデル概要

このモデルはwav2vec2-baseの微調整バージョンで、主に音声認識タスクに使用されますが、現在のパフォーマンスは不十分です(WERは0.9954と高い)

モデル特徴

データ拡張訓練
訓練プロセスで0.1の比率のデータ拡張技術が適用されました
wav2vec2アーキテクチャベース
facebookのwav2vec2-baseをベースモデルとして採用しています

モデル能力

音声認識
音響特徴抽出

使用事例

音声処理
音声からテキストへ
音声内容をテキストに変換します
現在の単語誤り率は高い(WER=0.9954)
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase