D

Distill Whisper Th Medium

由biodatlab開發
基於Whisper架構的蒸餾版自動語音識別模型,專為泰語優化,性能與效率兼備
下載量 303
發布時間 : 1/16/2024

模型概述

這是一個專為泰語語音識別設計的蒸餾版Whisper模型,通過從大型教師模型蒸餾而來,在保持較高識別準確率的同時提升了效率。

模型特點

高效蒸餾架構
採用4層解碼器結構(原教師模型為24層),在保持性能的同時顯著提升效率
泰語優化
專門針對泰語語音特點進行優化訓練
多源訓練數據
使用包括Common Voice、Gowajee、泰國老年人語音語料庫等多來源數據進行訓練
方言支持
包含泰中方言等方言數據,提升對方言的識別能力

模型能力

泰語語音識別
方言識別
高效語音轉文本

使用案例

語音轉寫
泰語會議記錄
將泰語會議內容即時轉寫為文本
語音筆記
將泰語語音筆記轉換為可搜索的文本
無障礙應用
聽力輔助
為聽力障礙者提供即時字幕
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase