W

Wav2vec2 Base Timit Demo Google Colab

Developed by Nancyzzz
facebook/wav2vec2-baseモデルをTIMITデータセットでファインチューニングした音声認識モデル
Downloads 103
Release Time : 6/29/2022

Model Overview

このモデルは英語音声認識用のwav2vec2-baseのファインチューニング版で、TIMITデータセットで訓練され、英語音声をテキストに変換できます

Model Features

効率的な音声認識
wav2vec2アーキテクチャに基づき、効率的な英語音声認識能力を提供
ファインチューニング最適化
TIMITデータセットでファインチューニングを行い、音声認識性能を最適化
軽量モデル
wav2vec2-baseバージョンに基づき、比較的軽量で展開が容易

Model Capabilities

英語音声認識
音声からテキストへの変換

Use Cases

音声文字起こし
会議議事録
英語の会議録音を自動的に文字記録に変換
単語誤り率約34%
音声メモ
英語の音声メモを編集可能なテキストに変換
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase