W

Whisper Th Large V3 Combined

由biodatlab開發
這是一個基於 OpenAI 的 Whisper Large V3 模型微調的泰語自動語音識別模型,在 Common Voice 13 泰語測試集上取得了 6.59% 的詞錯誤率。
下載量 1,354
發布時間 : 2/20/2024

模型概述

該模型是針對泰語優化的自動語音識別(ASR)模型,在增強版的 Common Voice 13 和 FLEURS 數據集上進行微調,專門用於泰語語音轉錄任務。

模型特點

低詞錯誤率
在 Common Voice 13 泰語測試集上僅 6.59% 的詞錯誤率(WER)
泰語優化
專門針對泰語語音特性進行微調
混合數據集訓練
使用 Common Voice 13 和 FLEURS 等多個數據集增強訓練

模型能力

泰語語音識別
音頻轉錄
長音頻處理(支持30秒分塊)

使用案例

語音轉錄
泰語會議記錄
將泰語會議錄音自動轉錄為文字
高準確率的轉錄文本
泰語媒體字幕生成
為泰語視頻內容自動生成字幕
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase