粵語語音識別

# 粵語語音識別

Whisper Large V3 Cantonese

基於Whisper v3微調的粵語自動語音識別模型，在Common Voice 17數據集上訓練

Transformers 其他

Distil Whisper Small Cantonese

這是一個基於Whisper Small的粵語語音識別蒸餾模型，在Common Voice 16.0上實現了9.7的CER（無標點符號）。

Transformers 中文

Whisper Large V2 Cantonese

基於OpenAI Whisper Large V2模型微調的粵語自動語音識別(ASR)模型，在Common Voice 11.0粵語數據集上訓練，字錯誤率(CER)為6.21%。

Transformers 其他

Whisper Large V2 Cantonese

基於OpenAI Whisper Large V2在粵語數據集上微調的自動語音識別模型，在測試集上達到6.7274%的字錯誤率

Transformers 其他

Whisper Small Cantonese

基於OpenAI Whisper-small微調的粵語語音識別模型，在Common Voice 16.0測試集上CER為7.93

Transformers 支持多種語言

Wav2vec2 Large Xlsr 53 Cantonese

基於facebook/wav2vec2-large-xlsr-53模型，使用Common Voice語料庫8.0版對粵語進行微調的語音識別模型

Transformers 其他

Wav2vec2 Large Xlsr Cantonese

基於Facebook的wav2vec2-large-xlsr-53模型微調的粵語語音識別模型，支持16kHz採樣率的語音輸入。

語音識別其他

Wav2vec2 Large Xls R 300m Cantonese

這是一個基於facebook/wav2vec2-xls-r-300m模型在粵語(香港)數據集上微調的自動語音識別(ASR)模型，專門用於處理粵語語音識別任務。

Transformers 中文

Wav2vec2 Large Xlsr 53 Hk

基於facebook/wav2vec2-large-xlsr-53在粵語（使用Common Voice數據集）上進行微調的語音識別模型

Wav2vec2 Xls R 300m Zh HK V2

基於XLS-R架構的粵語自動語音識別模型，在Common Voice粵語數據集上微調

Wav2vec2 Xls R 300m Zh HK Lm V2

基於XLS-R架構的自動語音識別模型，針對粵語(zh-HK)優化，在Common Voice數據集上微調並加入5-gram語言模型。

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase