W

Wav2vec2 Model1 Torgo

modhpによって開発
facebook/wav2vec2-baseをベースに微調整した音声認識モデル
ダウンロード数 20
リリース時間 : 3/24/2022

モデル概要

このモデルはfacebook/wav2vec2-baseを未知のデータセットで微調整した音声認識モデルで、主に音声からテキストへの変換タスクに使用されます。

モデル特徴

wav2vec2アーキテクチャベース
facebookのwav2vec2-baseを基本アーキテクチャとして採用し、優れた音声特徴抽出能力を有しています
微調整最適化
特定のデータセットで微調整されており、特定の音声特徴やアクセントに最適化されている可能性があります
効率的なトレーニング
混合精度トレーニング(ネイティブAMP)と線形学習率スケジューラを使用し、トレーニング効率を向上させています

モデル能力

音声認識
音声からテキストへの変換

使用事例

音声処理
音声文字起こし
音声内容をテキストに変換する
音声コマンド認識
音声コマンドを認識し、実行可能な指令に変換する
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase