Wav2vec2 Base Sound2

W

Wav2vec2 Base Sound2

learningdudeによって開発

facebook/wav2vec2-baseをファインチューニングした音声処理モデルで、評価セットで53.57%の精度を達成

オープンソースライセンス:Apache-2.0 #音響特徴抽出 #音声分類 #転移学習

ダウンロード数 17

リリース時間 : 5/5/2022

モデル概要

このモデルはwav2vec2-baseのファインチューニング版で、音声関連タスクに適しています。具体的な用途はさらに確認が必要です

モデル特徴

wav2vec2-baseをベースにファインチューニング

基本モデルを最適化し、特定の音声処理タスクに適合

中程度の精度

評価セットで53.57%の精度を達成

モデル能力

音響特徴抽出

音声分類

使用事例

音声分析

環境音認識

さまざまなタイプの環境音を識別

🚀 wav2vec2-base-sound2

このモデルは、未知のデータセットで facebook/wav2vec2-base をファインチューニングしたバージョンです。評価セットでは以下の結果を達成しています。

損失: 1.5012
正解率: 0.5357

📚 ドキュメント

モデルの説明

詳細な情報は後日追加予定です。

想定される用途と制限

詳細な情報は後日追加予定です。

学習と評価データ

詳細な情報は後日追加予定です。

学習手順

学習ハイパーパラメータ

学習中に使用されたハイパーパラメータは以下の通りです。

学習率: 9e-05
学習バッチサイズ: 32
評価バッチサイズ: 32
シード: 42
勾配累積ステップ: 4
総学習バッチサイズ: 128
オプティマイザ: Adam (betas=(0.9,0.999), epsilon=1e-08)
学習率スケジューラの種類: linear
学習率スケジューラのウォームアップ率: 0.1
エポック数: 25

学習結果

学習損失	エポック	ステップ	検証損失	正解率
記録なし	1.0	1	2.0762	0.0714
記録なし	2.0	2	2.0638	0.1429
記録なし	3.0	3	2.0387	0.2143
記録なし	4.0	4	2.0124	0.2143
記録なし	5.0	5	1.9864	0.2143
記録なし	6.0	6	1.9609	0.2143
記録なし	7.0	7	1.9235	0.2143
記録なし	8.0	8	1.9379	0.2143
記録なし	9.0	9	1.8627	0.2857
1.9713	10.0	10	1.8277	0.3214
1.9713	11.0	11	1.7765	0.3571
1.9713	12.0	12	1.7204	0.5
1.9713	13.0	13	1.6956	0.5
1.9713	14.0	14	1.6602	0.5357
1.9713	15.0	15	1.6277	0.5714
1.9713	16.0	16	1.6053	0.5
1.9713	17.0	17	1.5825	0.5
1.9713	18.0	18	1.5656	0.4286
1.9713	19.0	19	1.5616	0.4643
1.6334	20.0	20	1.5613	0.4286
1.6334	21.0	21	1.5419	0.5
1.6334	22.0	22	1.5166	0.5357
1.6334	23.0	23	1.5088	0.5
1.6334	24.0	24	1.5052	0.5
1.6334	25.0	25	1.5012	0.5357

フレームワークのバージョン

Transformers 4.18.0
Pytorch 1.11.0+cu113
Datasets 1.14.0
Tokenizers 0.12.1

📄 ライセンス

このモデルは Apache-2.0 ライセンスの下で提供されています。

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase