モデル選定

タイ語音声認識

# タイ語音声認識

Pathumma Whisper Th Medium

OpenAI Whisper-mediumをファインチューニングしたタイ語音声認識モデルで、タイ語と英語の自動音声認識タスクをサポートします。

Transformers 複数言語対応

Pathumma Whisper Th Large V3

Pathumma Whisper Large V3 はOpenAI Whisperアーキテクチャに基づくタイ語自動音声認識モデルで、タイ語と英語の音声文字起こしタスクをサポートします。

Transformers 複数言語対応

Monsoon Whisper Medium Gigaspeech2

Monsoon-Whisper-Medium-GigaSpeech2は、タイ語自動音声認識（ASR）モデルで、Whisper-Mediumを基にGigaSpeech2データセットで微調整されており、実世界の音声認識に適しています。

Whisper Th Large V3 Combined

これはOpenAIのWhisper Large V3モデルをファインチューニングしたタイ語自動音声認識モデルで、Common Voice 13のタイ語テストセットで6.59%の単語誤り率を達成しました。

Distill Whisper Th Medium

Whisperアーキテクチャに基づく蒸留版自動音声認識モデルで、タイ語に最適化されており、性能と効率性を兼ね備えています

Whisper Th Medium Combined

openai/whisper-mediumをベースに、拡張版のタイ語データセットで微調整し、タイ語の自動音声認識に使用する。

Exp W2v2t Th Hubert S533

facebook/hubert-large-ll60kをベースにファインチューニングしたタイ語音声認識モデル、トレーニングデータはCommon Voice 7.0から取得

Transformers その他

Exp W2v2t Th Wav2vec2 S664

facebook/wav2vec2-large-lv60モデルをファインチューニングしたタイ語音声認識モデル、Common Voice 7.0データセットでトレーニング

Transformers その他

Wav2vec2 Large Xlsr 53 Th Cv8 Deepcut

このモデルはCommonVoice V8データセットで訓練されたタイ語自動音声認識モデルで、deepcut分かち書きと言語モデルを組み合わせて認識精度を向上させています。

Transformers その他

Wav2vec2 Large Xlsr 53 Th Cv8 Newmm

このモデルはCommonVoice V8データセットでトレーニングされたタイ語自動音声認識モデルで、wav2vec2-large-xlsr-53アーキテクチャを採用し、newmmトークナイザーを使用し、言語モデルを統合することで、タイ語音声認識の精度を大幅に向上させています。

Transformers その他

Wav2vec2 Large Xlsr Thai Demo

facebook/wav2vec2-large-xlsr-53をタイ語汎用音声データセットでファインチューニングした音声認識モデル

Transformers その他

Wav2vec2 Large Xlsr Thai Tokenized

これはWav2Vec2-Large-XLSR-53アーキテクチャに基づくタイ語自動音声認識(ASR)モデルで、Common Voiceデータセットでファインチューニングされ、deepcut分かち書きツールを使用してトレーニングされました。

音声認識その他

Wav2vec2 Large Xlsr 53 Th

これはwav2vec2-large-xlsr-53モデルをベースに、タイ語Common Voice 7.0データセットでファインチューニングした自動音声認識(ASR)モデルです。

Transformers その他

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase