W

Whisper Th Large V3 Combined

Developed by biodatlab
這是一個基於 OpenAI 的 Whisper Large V3 模型微調的泰語自動語音識別模型,在 Common Voice 13 泰語測試集上取得了 6.59% 的詞錯誤率。
Downloads 1,354
Release Time : 2/20/2024

Model Overview

該模型是針對泰語優化的自動語音識別(ASR)模型,在增強版的 Common Voice 13 和 FLEURS 數據集上進行微調,專門用於泰語語音轉錄任務。

Model Features

低詞錯誤率
在 Common Voice 13 泰語測試集上僅 6.59% 的詞錯誤率(WER)
泰語優化
專門針對泰語語音特性進行微調
混合數據集訓練
使用 Common Voice 13 和 FLEURS 等多個數據集增強訓練

Model Capabilities

泰語語音識別
音頻轉錄
長音頻處理(支持30秒分塊)

Use Cases

語音轉錄
泰語會議記錄
將泰語會議錄音自動轉錄為文字
高準確率的轉錄文本
泰語媒體字幕生成
為泰語視頻內容自動生成字幕
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase