E

Exp W2v2t Th Wav2vec2 S664

由jonatasgrosman開發
基於facebook/wav2vec2-large-lv60模型微調的泰語語音識別模型,使用Common Voice 7.0數據集訓練
下載量 14
發布時間 : 7/8/2022

模型概述

該模型是針對泰語語音識別任務進行微調的自動語音識別(ASR)模型,支持16kHz採樣率的語音輸入。

模型特點

泰語語音識別
專門針對泰語優化的語音識別能力
基於wav2vec2架構
使用facebook的wav2vec2-large-lv60作為基礎模型
Common Voice數據集訓練
使用Mozilla Common Voice 7.0數據集進行微調

模型能力

泰語語音轉文本
自動語音識別

使用案例

語音轉寫
泰語語音轉錄
將泰語語音內容轉換為文本
語音助手
泰語語音指令識別
用於泰語語音助手或語音控制系統的語音識別模塊
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase