W

Wav2vec2 Base Timit Moaiz Exp2

moaiz237によって開発
facebook/wav2vec2-baseモデルをTIMITデータセットでファインチューニングした音声認識モデル
ダウンロード数 24
リリース時間 : 4/30/2022

モデル概要

このモデルはwav2vec2-baseのファインチューニング版で、英語音声認識タスクに特化し、TIMITデータセットで最適化トレーニングされています。

モデル特徴

高効率音声認識
wav2vec2アーキテクチャに基づき、効率的な英語音声認識能力を提供
ファインチューニング最適化
TIMITデータセットで特別にファインチューニングされており、このデータセットでより優れたパフォーマンスを発揮する可能性があります

モデル能力

英語音声認識
音声からテキスト変換

使用事例

音声文字起こし
英語音声文字起こし
英語音声コンテンツをテキスト形式に変換
単語誤り率(Wer): 1.0
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase