モデル選定

高精度オーディオ分類

# 高精度オーディオ分類

Wav2vec2 Vd Bird Sound Classification

wav2vec2-baseでトレーニングされた鳥類音声分類モデル。インドのVedanthangal鳥類保護区の21種の鳥類を識別可能

Transformers 英語

Wav2Vec2をファインチューニングしたオーディオ分類器で、実在人物の音声とAI生成音声を区別できます。

Transformers 英語

Wavlm Large Finetuned SER

WavLM-Largeベースの音声感情認識モデルで、英語音声の感情分類をサポートします。

音声分類英語

Distilhubert Finetuned Cry Detector

distilhubertアーキテクチャを微調整した泣き声検出モデルで、評価データセットで優れた性能を示し、精度は98.83%に達しました

Urdu Emotions Whisper Medium

Whisper-mediumをファインチューニングしたウルドゥー語感情認識モデル、評価セットで91.67%の精度を達成

Pak-Speech-Processing

Wav2vec2 Large Xlsr 53 English Finetuned Ravdess

wav2vec2-large-xlsr-53-englishモデルをRAVDESSデータセットでファインチューニングした音声感情認識モデル

AST ASVspoof2019 Synthetic Voice Detection

このモデルはMIT/ast-finetuned-audioset-10-10-0.4593を微調整したバージョンで、合成音声を検出するために使用されます。

Transformers 英語

Wav2vec2 Animal Sounds Finetuned Hubert Finetuned Animals

HuBERTアーキテクチャを基にファインチューニングした動物音声分類モデル。10種類の動物の鳴き声を認識可能で、精度は95%

Whisper Tiny Bn Emo

shhossain/whisper-tiny-bnをファインチューニングした感情分類モデルで、ベンガル語の7つの基本感情を認識可能

Transformers その他

Speechcommand Demo

facebook/wav2vec2-baseをファインチューニングした音声コマンド分類モデル、superbデータセットでトレーニングされ、精度98.09%を達成

Internal.wav2vec2 Base Superb Ks Int8 Structured79

このモデルはwav2vec2-base-ft-keyword-spottingをsuperbデータセットでファインチューニングしたバージョンで、オーディオ分類タスク用に量子化と構造化プルーニング最適化が施されています。

Trillsson3 Ft Keyword Spotting

TRillsson3アーキテクチャに基づくオーディオ分類モデル、superbデータセットでファインチューニングされ、キーワード認識タスクに使用

Trillsson3 Ft Keyword Spotting 13

TRillsson3アーキテクチャに基づくオーディオ分類モデル、superbデータセットでファインチューニングされ、キーワード認識タスク用

Trillsson3 Ft Keyword Spotting 12

TRillsson3アーキテクチャに基づくオーディオ分類モデルで、キーワード検出タスクに微調整され、評価セットで91.5%の精度を達成しました。

Urdu Audio Emotions

facebook/wav2vec2-large-xlsr-53をファインチューニングしたウルドゥー語オーディオ感情分類モデル。怒り、喜び、平静、悲しみの4つの感情認識をサポート

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase