# タイ語音声認識

Pathumma Whisper Th Medium
Apache-2.0
OpenAI Whisper-mediumをファインチューニングしたタイ語音声認識モデルで、タイ語と英語の自動音声認識タスクをサポートします。
音声認識 Transformers 複数言語対応
P
nectec
16
1
Pathumma Whisper Th Large V3
Apache-2.0
Pathumma Whisper Large V3 はOpenAI Whisperアーキテクチャに基づくタイ語自動音声認識モデルで、タイ語と英語の音声文字起こしタスクをサポートします。
音声認識 Transformers 複数言語対応
P
nectec
352
4
Monsoon Whisper Medium Gigaspeech2
Apache-2.0
Monsoon-Whisper-Medium-GigaSpeech2は、タイ語自動音声認識(ASR)モデルで、Whisper-Mediumを基にGigaSpeech2データセットで微調整されており、実世界の音声認識に適しています。
音声認識 Transformers
M
scb10x
546
5
Whisper Th Large V3 Combined
Apache-2.0
これはOpenAIのWhisper Large V3モデルをファインチューニングしたタイ語自動音声認識モデルで、Common Voice 13のタイ語テストセットで6.59%の単語誤り率を達成しました。
音声認識 Transformers
W
biodatlab
1,354
9
Distill Whisper Th Medium
MIT
Whisperアーキテクチャに基づく蒸留版自動音声認識モデルで、タイ語に最適化されており、性能と効率性を兼ね備えています
音声認識 Transformers
D
biodatlab
303
2
Whisper Th Medium Combined
Apache-2.0
openai/whisper-mediumをベースに、拡張版のタイ語データセットで微調整し、タイ語の自動音声認識に使用する。
音声認識 Transformers
W
biodatlab
4,167
17
Exp W2v2t Th Hubert S533
Apache-2.0
facebook/hubert-large-ll60kをベースにファインチューニングしたタイ語音声認識モデル、トレーニングデータはCommon Voice 7.0から取得
音声認識 Transformers その他
E
jonatasgrosman
19
0
Exp W2v2t Th Wav2vec2 S664
Apache-2.0
facebook/wav2vec2-large-lv60モデルをファインチューニングしたタイ語音声認識モデル、Common Voice 7.0データセットでトレーニング
音声認識 Transformers その他
E
jonatasgrosman
14
0
Wav2vec2 Large Xlsr 53 Th Cv8 Deepcut
Apache-2.0
このモデルはCommonVoice V8データセットで訓練されたタイ語自動音声認識モデルで、deepcut分かち書きと言語モデルを組み合わせて認識精度を向上させています。
音声認識 Transformers その他
W
wannaphong
504
5
Wav2vec2 Large Xlsr 53 Th Cv8 Newmm
Apache-2.0
このモデルはCommonVoice V8データセットでトレーニングされたタイ語自動音声認識モデルで、wav2vec2-large-xlsr-53アーキテクチャを採用し、newmmトークナイザーを使用し、言語モデルを統合することで、タイ語音声認識の精度を大幅に向上させています。
音声認識 Transformers その他
W
wannaphong
6,486
3
Wav2vec2 Large Xlsr Thai Demo
Apache-2.0
facebook/wav2vec2-large-xlsr-53をタイ語汎用音声データセットでファインチューニングした音声認識モデル
音声認識 Transformers その他
W
sakares
609
5
Wav2vec2 Large Xlsr Thai Tokenized
Apache-2.0
これはWav2Vec2-Large-XLSR-53アーキテクチャに基づくタイ語自動音声認識(ASR)モデルで、Common Voiceデータセットでファインチューニングされ、deepcut分かち書きツールを使用してトレーニングされました。
音声認識 その他
W
chompk
44
2
Wav2vec2 Large Xlsr 53 Th
これはwav2vec2-large-xlsr-53モデルをベースに、タイ語Common Voice 7.0データセットでファインチューニングした自動音声認識(ASR)モデルです。
音声認識 Transformers その他
W
airesearch
110.74k
21
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase