ネウニット－ニハオチャンチュ－V3オープンソース音声分類モデル

ホーム

Neunit Nihaochangchu V3

SHENMU007によって開発

facebook/wav2vec2-baseをファインチューニングしたオーディオ分類モデル、superbデータセットでトレーニングされ、精度は99.99%

音声分類

Transformers

オープンソースライセンス:Apache-2.0 #オーディオ高精度分類 #wav2vec2ファインチューニング #超低損失モデル

ダウンロード数 14

リリース時間 : 6/30/2023

モデル概要

このモデルはオーディオ分類タスク用のファインチューニングモデルで、wav2vec2アーキテクチャに基づき、特定のデータセットで極めて高い精度を示します

モデル特徴

高精度

評価データセットで99.99%の精度を達成

wav2vec2アーキテクチャベース

facebook/wav2vec2-baseをベースモデルとしてファインチューニング

効率的なトレーニング

混合精度トレーニングや勾配蓄積などの技術でトレーニングプロセスを最適化

モデル能力

オーディオ分類

音声特徴抽出

使用事例

音声処理

音声コマンド認識

特定の音声コマンドやキーワードを認識

高精度なコマンド認識

オーディオコンテンツ分類

オーディオコンテンツを分類・識別

異なるタイプのオーディオコンテンツを正確に区別

トレーニング損失	エポック	ステップ	検証損失	精度
0.0058	1.0	3363	0.0030	0.9992
0.0078	2.0	6727	0.0038	0.9994
0.0001	3.0	10090	0.0006	0.9998
0.0001	4.0	13454	0.0006	0.9998
0.0	5.0	16815	0.0004	0.9999

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Neunit Nihaochangchu V3

モデル概要

モデル特徴

モデル能力

使用事例

🚀 neunit-nihaochangchu-V3

📚 ドキュメント

トレーニング手順

トレーニングハイパーパラメータ

トレーニング結果

フレームワークバージョン

📄 ライセンス