W

Wav2vec2 Base MIR ST500 ASR 109

Developed by gary109
facebook/wav2vec2-baseをベースにMIR_ST500データセットでファインチューニングした自動音声認識モデル
Downloads 15
Release Time : 4/15/2022

Model Overview

このモデルは自動音声認識(ASR)タスク用にファインチューニングされたバージョンで、MIR_ST500データセットでトレーニングされ、音声をテキストに変換できます。

Model Features

wav2vec2アーキテクチャベース
facebookのwav2vec2-baseを基本アーキテクチャとして採用し、優れた音声特徴抽出能力を有する
特定ドメインファインチューニング
MIR_ST500データセットでファインチューニングされており、特定のドメインやアクセントに最適化されている可能性がある
マルチGPUトレーニング
2つのGPUを使用した分散トレーニングにより、トレーニング効率が向上

Model Capabilities

音声からテキストへ
自動音声認識

Use Cases

音声文字起こし
会議議事録
会議録音を自動的に文字記録に変換
音声メモ
音声メモを検索可能なテキストに変換
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase