W

Wav2vec2 Base Timit Demo Google Colab

Nancyzzzによって開発
facebook/wav2vec2-baseモデルをTIMITデータセットでファインチューニングした音声認識モデル
ダウンロード数 103
リリース時間 : 6/29/2022

モデル概要

このモデルは英語音声認識用のwav2vec2-baseのファインチューニング版で、TIMITデータセットで訓練され、英語音声をテキストに変換できます

モデル特徴

効率的な音声認識
wav2vec2アーキテクチャに基づき、効率的な英語音声認識能力を提供
ファインチューニング最適化
TIMITデータセットでファインチューニングを行い、音声認識性能を最適化
軽量モデル
wav2vec2-baseバージョンに基づき、比較的軽量で展開が容易

モデル能力

英語音声認識
音声からテキストへの変換

使用事例

音声文字起こし
会議議事録
英語の会議録音を自動的に文字記録に変換
単語誤り率約34%
音声メモ
英語の音声メモを編集可能なテキストに変換
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase