W

Wav2vec2 17

chrisvinsenによって開発
facebook/wav2vec2-baseをファインチューニングした音声認識モデルで、自動音声テキスト変換タスクをサポートします。
ダウンロード数 17
リリース時間 : 6/1/2022

モデル概要

このモデルはfacebook/wav2vec2-baseをファインチューニングしたバージョンで、主に自動音声認識(ASR)タスクに使用されます。

モデル特徴

効率的なファインチューニング
wav2vec2-baseモデルを基にファインチューニングを行い、音声認識性能を最適化しました。
安定したトレーニング
30エポックのトレーニングを経て、検証損失は約3.1で安定しています。

モデル能力

音声認識
音声からテキストへの変換

使用事例

音声処理
音声文字起こし
音声内容をテキストに変換
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase