W

Wav2vec2 Base Timit Demo Google Colab

onesによって開発
このモデルはfacebook/wav2vec2-baseをベースにファインチューニングしたバージョンで、主に音声認識タスクに使用されます。
ダウンロード数 108
リリース時間 : 6/29/2022

モデル概要

このモデルはfacebook/wav2vec2-baseをTIMITデータセットでファインチューニングしたバージョンで、音声認識タスクに使用されます。

モデル特徴

wav2vec2-baseベースのファインチューニング
このモデルはfacebook/wav2vec2-baseアーキテクチャをベースにファインチューニングされており、特定の音声認識タスクに適しています。
低いトレーニング損失
トレーニングプロセスにおいて、モデルは低い損失値を示し、良好なフィッティング能力を持っていることを示しています。

モデル能力

音声認識
音声からテキストへの変換

使用事例

音声認識
音声からテキストへ
音声信号をテキスト内容に変換する
単語誤り率(Wer):0.9988
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase