W

Wav2vec Mle

eugenetanjcによって開発
facebook/wav2vec2-base-960hをベースにファインチューニングした音声認識モデルで、評価セットでの単語誤り率は1.0
ダウンロード数 68
リリース時間 : 6/24/2022

モデル概要

このモデルはwav2vec2アーキテクチャに基づく音声認識モデルで、ファインチューニング後に音声からテキストへの変換タスクに使用可能

モデル特徴

wav2vec2アーキテクチャ採用
Facebookが開発したwav2vec2-base-960hをベースモデルとして使用
ファインチューニング最適化
特定のデータセットでファインチューニングを行い、音声認識性能を最適化

モデル能力

音声からテキストへの変換
自動音声認識

使用事例

音声文字起こし
会議議事録
会議の録音を自動的に文字記録に変換
音声メモ
音声メモを検索可能なテキストに変換
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase