M

My Frugal Audio Model

hsalehILBによって開発
これはfacebook/wav2vec2-baseをファインチューニングした音声処理モデルで、主に音声関連タスクに使用されます
ダウンロード数 1
リリース時間 : 1/31/2025

モデル概要

このモデルはfacebook/wav2vec2-baseのファインチューン版で、音声処理タスクに適しており、検証セットで88.62%の精度を達成しました

モデル特徴

高精度
検証セットで88.62%の精度を達成
効率的なトレーニング
混合精度トレーニングを使用し、トレーニング効率を最適化
wav2vec2ベース
確立されたwav2vec2-baseアーキテクチャを基に構築

モデル能力

音声処理
音声特徴抽出

使用事例

音声認識
音声からテキストへ
音声信号をテキスト内容に変換
精度88.62%
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase