モデル選定

韓国語音声認識

# 韓国語音声認識

Phi 4 Multimodal Instruct Ko Asr

microsoft/Phi-4-multimodal-instructを微調整した韓国語自動音声認識(ASR)および音声翻訳(AST)モデルで、zeroth-koreanとfleursデータセットで優れた性能を発揮します。

テキスト生成オーディオ

Transformers 韓国語

Whisper Large V3 Turbo Korean

zeroth韓国語データセットでファインチューニングされたWhisper Large V3 Turboモデル、韓国語音声認識タスクに最適化

TensorBoard 韓国語

Wav2vec2 Base Korean

Facebookのwav2vec2-baseモデルを微調整して、韓国語音声認識に特化して最適化され、韓国語の音声を正確にテキストに起こすことができます。

Transformers 韓国語

Wav2vec2 Large Xlrs Korean V5

このモデルはfacebook/wav2vec2-xls-r-300mをzeroth_koreanデータセットでファインチューニングした韓国語自動音声認識モデルで、単語誤り率は0.2433です。

Whisper Small Ko

Whisper Smallアーキテクチャに基づく韓国語音声認識モデルで、多様な韓国語データセットに対してファインチューニングされています

Transformers 韓国語

Stt Kr Conformer Ctc Medium

Conformerアーキテクチャに基づく韓国語自動音声認識モデルで、ストリーミング処理に最適化されており、カスタマーサポート音声などの特定分野で優れた性能を発揮します

音声認識韓国語

Hubert Large Korean

Hubert-large-koreanはHubertアーキテクチャに基づく韓国語自動音声認識モデルで、自己教師付き学習により音声波形から直接特徴を抽出し、韓国語音声処理において優れた性能を発揮します。

Transformers 韓国語

Hubert Base Korean

Hubert（Hidden-Unit BERT）はFacebookが提案した音声表現学習モデルで、自己教師あり学習方式で生の波形信号から直接音声特徴を学習します。

音声認識韓国語

Whisper Large V2 Ko

OpenAI Whisper-large-v2をファインチューニングした韓国語自動音声認識(ASR)モデルで、韓国語データセットで優れた性能を発揮

Transformers 韓国語

Whisper Medium Ko Zeroth

OpenAI Whisper MediumモデルをZeroth韓国語データセットでファインチューニングした音声認識モデル、単語誤り率3.64%

Transformers 韓国語

Whisper Small Ko Zeroth

Zeroth Koreanデータセットを基に微調整された韓国語自動音声認識モデルで、単語誤り率は6.76%です。

Transformers 韓国語

Wav2vec2 Ksponspeech

Ksponspeechデータセットでファインチューニングされた韓国語音声認識モデルで、Wav2vec2-large-xlsr-53を基に最適化

Stt Kr Conformer Transducer Large

これはConformer-Transducerアーキテクチャに基づく大規模な韓国語自動音声認識モデルで、Ksponspeechデータセットでトレーニングされ、韓国語音声の文字起こしタスクに適しています。

音声認識その他

Wav2vec2 Xlsr Korean Senior

wav2vec2-xlsrアーキテクチャに基づく韓国語自動音声認識モデルで、韓国の高齢者音声に特化して最適化されています

Transformers その他

Wav2vec2 Large Xlsr Korean

Wav2Vec2 XLSRアーキテクチャに基づく韓国語自動音声認識(ASR)モデルで、Zeroth韓国語データセットで優れた性能を発揮

Transformers 韓国語

Wav2vec2 Xls R 1b Korean

このモデルは、facebook/wav2vec2-xls-r-1bをKRESNIK/ZEROTH_KOREAN - CLEANデータセットでファインチューニングした韓国語自動音声認識モデルです。

Transformers 韓国語

Wav2vec2 Xls R 300m Korean

XLS-Rアーキテクチャに基づく韓国語自動音声認識モデル、Zeroth Koreanデータセットでファインチューニング済み

Transformers 韓国語

Wav2vec2 Xls R 300m Korean Lm

XLS-Rアーキテクチャに基づく韓国語自動音声認識モデルで、Zeroth韓国語データセットで微調整され、5-gram言語モデルが追加されています

Transformers 韓国語

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase