N

Neunit Ks

SHENMU007によって開発
facebook/wav2vec2-baseを微調整した音声処理モデル、精度は28.57%
ダウンロード数 23
リリース時間 : 5/8/2023

モデル概要

このモデルはfacebook/wav2vec2-baseを未知のデータセットで微調整したバージョンで、主に音声関連タスクに使用されます

モデル特徴

wav2vec2-baseベースの微調整
確立されたwav2vec2-baseアーキテクチャをベースモデルとして微調整しています
線形学習率スケジューリング
トレーニングプロセスでは線形学習率スケジューリング戦略を採用し、10%のウォームアップ段階を含みます

モデル能力

音声処理
音声特徴抽出

使用事例

音声認識
基本音声認識
基本的な音声からテキストへの変換タスクに使用可能
精度28.57%
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase