W

Wav2vec2 Base Toy Train Data Augmented

scasuttによって開発
facebook/wav2vec2-baseモデルをベースにファインチューニングした音声認識モデルで、拡張されたトレーニングデータで最適化されています。
ダウンロード数 22
リリース時間 : 3/26/2022

モデル概要

このモデルはwav2vec2アーキテクチャに基づく音声認識モデルで、特定のデータセットでファインチューニングにより認識精度を向上させています。

モデル特徴

データ拡張トレーニング
モデルはトレーニング過程でデータ拡張技術を使用し、汎化能力を向上させています。
低単語誤り率
ファインチューニング後、モデルは検証セットで低い単語誤り率(Wer)を達成しました。

モデル能力

音声認識
音声からテキストへの変換

使用事例

音声文字起こし
会議議事録の文字起こし
会議の録音を自動的にテキストに変換し、記録と検索を容易にします。
音声アシスタント
音声アシスタントの音声認識モジュールに使用され、認識精度を向上させます。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase