モデル選定

Whisper微調整

# Whisper微調整

Whisper Large V3 Speech Flow

Whisper Large v3を基にした音声流暢性分類モデルで、音声の流暢性と非流暢タイプを検出可能

Safetensors 英語

Whisper Finetuned

Whisper-large-v3-turboを微調整したインド英語アクセント音声認識モデル、単語誤り率4.39%

Transformers 英語

Whisper Large V3 Cantonese

Whisper v3を微調整した広東語自動音声認識モデル、Common Voice 17データセットで訓練

Transformers その他

Speech Emotion Recognition With Openai Whisper Large V3

本プロジェクトではWhisperモデルを利用して音声感情認識を実現し、音声を喜び、悲しみ、驚きなどの異なる感情カテゴリに分類することができます。

Whisper Tiny De Emodb Emotion Classification

openai/whisper-tinyを微調整したドイツ語感情分類モデル、Emo-DBデータセットで91.59%の精度を達成

Transformers ドイツ語

Whisper Large V3 Myanmar

このモデルは、openai/whisper-large-v3をミャンマー語音声データセットで微調整した自動音声認識モデルで、ミャンマー語の音声文字起こしに特化しています。

Transformers その他

Monsoon Whisper Medium Gigaspeech2

Monsoon-Whisper-Medium-GigaSpeech2は、タイ語自動音声認識（ASR）モデルで、Whisper-Mediumを基にGigaSpeech2データセットで微調整されており、実世界の音声認識に適しています。

Pronunciation Accuracy

OpenAI Whisper-baseを微調整した発音正確度評価モデルで、音声発音の正確性を評価するために使用されます

Phowhisper Large

PhoWhisperはベトナム語自動音声認識のために特別に設計されたシステムで、Whisperモデルを微調整しており、さまざまなベトナム語のアクセントをサポートしています。

Transformers その他

Whisper Small Keyword Spotting

openai/whisper-smallを微調整した音声キーワード認識モデルで、kw-spotting-fsc-sl-agvデータセットで訓練され、評価精度は99.98%に達しました

FlandersMakeAGV

Whisper Medium Arabic

openai/whisper-mediumを微調整したアラビア語音声認識モデルで、ストリーミング処理に対応しています。

Whisper Large V2 Spanish

openai/whisper-large-v2を微調整したスペイン語音声認識モデル、Common Voice 11.0スペイン語テストセットでWER8.55%を達成

Whisper Medium Portuguese

openai/whisper-mediumをcommon_voice_11_0データセットで微調整したポルトガル語音声認識モデル、単語誤り率6.5987

Transformers その他

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase