Wav2vec2 Base Lang Id

W

Wav2vec2 Base Lang Id

anton-lによって開発

facebook/wav2vec2-baseをcommon_languageデータセットでファインチューニングした音声言語識別モデル

オープンソースライセンス:Apache-2.0 #音声言語識別 #多言語分類 #wav2vec2ファインチューニング

ダウンロード数 3,470

リリース時間 : 3/2/2022

モデル概要

このモデルは音声分類タスク、特に言語識別に使用され、異なる言語の音声内容を識別できます。

モデル特徴

高精度言語識別

評価データセットで79.45%の精度を達成

wav2vec2アーキテクチャベース

facebookのwav2vec2-baseをベースモデルとして採用

多言語サポート

common_languageデータセットで訓練され、複数言語の識別をサポート

モデル能力

音声言語識別

音声分類

使用事例

音声処理

多言語音声分類

音声フラグメントの言語カテゴリを識別

精度79.45%

音声内容分析

音声内容分析のための言語分類基盤を提供

🚀 wav2vec2-base-lang-id

このモデルは、anton-l/common_languageデータセットでfacebook/wav2vec2-baseをファインチューニングしたバージョンです。評価セットでは以下の結果を達成しています。

損失: 0.9836
正確度: 0.7945

🚀 クイックスタート

このモデルは音声分類タスクに使用できます。anton-l/common_languageデータセットで訓練されており、特定の音声関連のタスクに適しています。

📚 ドキュメント

モデルの説明

このモデルはfacebook/wav2vec2-baseをベースにanton-l/common_languageデータセットでファインチューニングされたものです。評価セットでの損失と正確度の結果が得られています。

想定される用途と制限

詳細情報はありません。

訓練と評価データ

詳細情報はありません。

訓練手順

訓練ハイパーパラメータ

訓練中に使用されたハイパーパラメータは以下の通りです。

属性	詳情
学習率	0.0003
訓練バッチサイズ	32
評価バッチサイズ	4
シード	0
勾配累積ステップ	4
総訓練バッチサイズ	128
オプティマイザ	Adam (betas=(0.9,0.999), epsilon=1e-08)
学習率スケジューラの種類	線形
学習率スケジューラのウォームアップ比率	0.1
エポック数	10.0
混合精度訓練	Native AMP

訓練結果

訓練損失	エポック	ステップ	検証損失	正確度
2.9568	1.0	173	3.2866	0.1146
1.9243	2.0	346	2.1241	0.3840
1.2923	3.0	519	1.5498	0.5489
0.8659	4.0	692	1.4953	0.6126
0.5539	5.0	865	1.2431	0.6926
0.4101	6.0	1038	1.1443	0.7232
0.2945	7.0	1211	1.0870	0.7544
0.1552	8.0	1384	1.1080	0.7661
0.0968	9.0	1557	0.9836	0.7945
0.0623	10.0	1730	1.0252	0.7993

フレームワークのバージョン

Transformers 4.11.0.dev0
Pytorch 1.9.1+cu111
Datasets 1.12.1
Tokenizers 0.10.3

📄 ライセンス

このモデルはApache-2.0ライセンスの下で提供されています。

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase