W

Wav2vec2 Large Xlsr 53 Th Cv8 Newmm

由wannaphong開發
該模型是基於CommonVoice V8數據集訓練的泰語自動語音識別模型,採用wav2vec2-large-xlsr-53架構,使用newmm分詞器並整合語言模型,顯著提升了泰語語音識別準確率。
下載量 6,486
發布時間 : 6/6/2022

模型概述

該模型專門針對泰語語音識別任務優化,通過結合CommonVoice V8數據集和語言模型,在詞錯誤率(WER)和字符錯誤率(CER)上表現出色。

模型特點

改進的數據集
使用CommonVoice V8數據集,相比V7版本數據量更大,訓練效果更優
優化的分詞處理
採用newmm分詞器進行預分詞處理,針對泰語特性優化
語言模型整合
結合語言模型進一步提升識別準確率
多指標評估
同時評估詞錯誤率(WER)和字符錯誤率(CER),全面衡量模型性能

模型能力

泰語語音識別
語音轉文本
多指標性能評估

使用案例

語音轉寫
泰語語音轉錄
將泰語語音內容轉換為文本
在CommonVoice V8測試集上達到12.58% WER(newmm分詞)
語音助手
泰語語音指令識別
用於泰語語音助手或智能設備的指令識別
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase