E

Exp W2v2t Th Hubert S533

由jonatasgrosman開發
基於facebook/hubert-large-ll60k微調的泰語語音識別模型,訓練數據來自Common Voice 7.0
下載量 19
發布時間 : 7/8/2022

模型概述

該模型是一個用於泰語自動語音識別(ASR)的模型,基於HuBERT架構微調完成,適用於16kHz採樣率的語音輸入。

模型特點

泰語語音識別
專門針對泰語優化的語音識別能力
基於HuBERT架構
使用facebook/hubert-large-ll60k作為基礎模型進行微調
Common Voice數據集訓練
使用Mozilla Common Voice 7.0數據集中的泰語部分進行訓練

模型能力

泰語語音轉文本
16kHz音頻處理

使用案例

語音轉寫
泰語語音轉錄
將泰語語音內容轉換為文本
語音助手
泰語語音命令識別
用於泰語語音助手或語音控制系統的命令識別
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase