D

Distill Whisper Th Medium

由 biodatlab 开发
基于Whisper架构的蒸馏版自动语音识别模型,专为泰语优化,性能与效率兼备
下载量 303
发布时间 : 1/16/2024

模型简介

这是一个专为泰语语音识别设计的蒸馏版Whisper模型,通过从大型教师模型蒸馏而来,在保持较高识别准确率的同时提升了效率。

模型特点

高效蒸馏架构
采用4层解码器结构(原教师模型为24层),在保持性能的同时显著提升效率
泰语优化
专门针对泰语语音特点进行优化训练
多源训练数据
使用包括Common Voice、Gowajee、泰国老年人语音语料库等多来源数据进行训练
方言支持
包含泰中方言等方言数据,提升对方言的识别能力

模型能力

泰语语音识别
方言识别
高效语音转文本

使用案例

语音转写
泰语会议记录
将泰语会议内容实时转写为文本
语音笔记
将泰语语音笔记转换为可搜索的文本
无障碍应用
听力辅助
为听力障碍者提供实时字幕
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase