オープンソースのneunit-ks-529音声分類モデル - SUPERBデータセットを基に微調整、精度はほぼ100%

ホーム

Neunit Ks 529

SHENMU007によって開発

facebook/wav2vec2-baseをSUPERBデータセットでファインチューニングした音声分類モデル、精度は99.98%

音声分類

Transformers

オープンソースライセンス:Apache-2.0 #音声分類 #高精度 #wav2vec2ファインチューニング

ダウンロード数 14

リリース時間 : 5/29/2023

モデル概要

このモデルは音声分類タスク用のファインチューニング版で、wav2vec2アーキテクチャに基づき、SUPERBデータセットで優れた性能を発揮します。

モデル特徴

高精度

評価セットで99.98%の精度を達成

wav2vec2アーキテクチャ採用

facebook/wav2vec2-baseをベースモデルとして使用

効率的なトレーニング

混合精度トレーニングと勾配蓄積技術を使用してトレーニングプロセスを最適化

モデル能力

音声分類

音声特徴抽出

使用事例

音声処理

音声コマンド認識

特定の音声コマンドやキーワードの識別に使用可能

高精度認識

音声コンテンツ分類

音声コンテンツを分類・タグ付け

学習損失	エポック	ステップ	検証損失	正確度
0.0303	1.0	1388	0.0231	0.9965
0.003	2.0	2777	0.0030	0.9995
0.0018	3.0	4165	0.0026	0.9995
0.0037	4.0	5554	0.0017	0.9998
0.0002	5.0	6940	0.0017	0.9998

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Neunit Ks 529

モデル概要

モデル特徴

モデル能力

使用事例

🚀 neunit-ks-529

🚀 クイックスタート

📚 ドキュメント

モデルの説明

想定される用途と制限事項

学習と評価データ

学習手順

学習ハイパーパラメータ

学習結果

フレームワークバージョン

📄 ライセンス