W

Wav2vec2 Large Xlsr 53 Th Cv8 Deepcut

由wannaphong開發
該模型是基於CommonVoice V8數據集訓練的泰語自動語音識別模型,結合了deepcut分詞器和語言模型以提高識別準確率。
下載量 504
發布時間 : 6/7/2022

模型概述

該模型使用泰語CommonVoice V8數據集對wav2vec2-large-xlsr-53進行微調,專門用於泰語語音識別任務,支持deepcut分詞器並整合了語言模型以提高性能。

模型特點

結合語言模型
整合語言模型顯著提高了識別準確率,在測試集上WER降低約3%。
支持多種分詞器
支持deepcut和newmm兩種泰語分詞器,可根據需求選擇最佳分詞方式。
多數據集訓練
結合CommonVoice V7和V8數據集進行訓練,提高了模型泛化能力。

模型能力

泰語語音識別
支持多種分詞方式
高準確率語音轉文本

使用案例

語音轉寫
泰語語音轉錄
將泰語語音內容轉換為文本
在CommonVoice V8測試集上達到9.61% WER
語音助手
泰語語音指令識別
用於泰語語音助手的指令識別系統
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase