W

Whisper Finetune Teochew

由panlr開發
基於Whisper-medium微調的潮州話(潮汕話)正字識別模型,支持多方言口音的正字轉錄
下載量 20
發布時間 : 3/17/2025

模型概述

該模型專門用於潮州話(潮汕話)的自動語音識別,採用獨創的歹看正字法標註,避免諧音字歧義問題。

模型特點

多方言支持
覆蓋潮州府城、汕頭市區、潮安南部、澄海及榕江音等多種口音
歹看正字法
採用獨創標註方案解決諧音字歧義問題(如用【介】替代易混淆的【個】)
野外錄音數據
基於18.9小時真實場景錄音訓練,包含12,500條標註樣本

模型能力

潮州話語音轉文字
多口音識別
正字轉錄

使用案例

方言保護
潮州話語音存檔
將口頭傳承的潮州話錄音轉為標準化文字記錄
CER 12.254%(測試集)
語音交互
方言語音助手
支持潮州話語音輸入的智能設備交互
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase