W

Wav2vec2 Base MIR ST500 ASR 109

gary109によって開発
facebook/wav2vec2-baseをベースにMIR_ST500データセットでファインチューニングした自動音声認識モデル
ダウンロード数 15
リリース時間 : 4/15/2022

モデル概要

このモデルは自動音声認識(ASR)タスク用にファインチューニングされたバージョンで、MIR_ST500データセットでトレーニングされ、音声をテキストに変換できます。

モデル特徴

wav2vec2アーキテクチャベース
facebookのwav2vec2-baseを基本アーキテクチャとして採用し、優れた音声特徴抽出能力を有する
特定ドメインファインチューニング
MIR_ST500データセットでファインチューニングされており、特定のドメインやアクセントに最適化されている可能性がある
マルチGPUトレーニング
2つのGPUを使用した分散トレーニングにより、トレーニング効率が向上

モデル能力

音声からテキストへ
自動音声認識

使用事例

音声文字起こし
会議議事録
会議録音を自動的に文字記録に変換
音声メモ
音声メモを検索可能なテキストに変換
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase