WER優化

# WER優化

Lite Whisper Large V3 Turbo

Lite-Whisper 是採用 LiteASR 技術壓縮的 OpenAI Whisper 輕量版，在保持較高準確率的同時顯著減小模型大小。

efficient-speech

Whisper Small El

這是一個基於openai/whisper-small模型在希臘語語音識別任務上微調的自動語音識別(ASR)模型，使用Mozilla Common Voice 17.0數據集中的3620個希臘語樣本進行訓練。

Transformers 其他

XLSR WithLM Malayalam

該模型是基於facebook/wav2vec2-xls-r-300m在IMaSC、Indic TTS Malayalam和OpenSLR Malayalam訓練集數據集上微調得到的版本，支持馬拉雅拉姆語自動語音識別。

Whisper Small Sk Cv11

基於OpenAI Whisper-small微調的斯洛伐克語語音識別模型，在Common Voice 11.0斯洛伐克語數據集上訓練

Transformers 其他

基於facebook/wav2vec2-base微調的語音識別模型，在評估集上詞錯誤率(WER)為0.8133

Wav2vec2 Base Demo Colab

基於facebook/wav2vec2-base模型微調的語音識別模型，在評估集上取得了31.42%的詞錯誤率

English Filipino Wav2vec2 L Xls R Test 04

該模型是基於jonatasgrosman/wav2vec2-large-xlsr-53-english在filipino_voice數據集上微調的版本，用於英語-菲律賓語語音識別任務。

English Filipino Wav2vec2 L Xls R Test

基於jonatasgrosman/wav2vec2-large-xlsr-53-english微調的英語-菲律賓語語音識別模型

Wav2vec2 Base Timit Demo

基於facebook/wav2vec2-base微調的語音識別模型，在TIMIT數據集上取得28.25%的詞錯誤率

Wav2vec2 Child En Tokenizer 4

該模型是基於facebook/wav2vec2-xls-r-300m微調的版本，專注於英語兒童語音識別任務。

Wav2vec2 Base Toy Train Data Random Low Pass

該模型是基於facebook/wav2vec2-base在未知數據集上微調的語音識別模型，主要用於自動語音識別(ASR)任務。

Wav2vec2 Large Xlsr 53 Toy Train Data Masked Audio 10ms

基於facebook/wav2vec2-large-xlsr-53微調的語音識別模型，在10ms音頻掩碼訓練數據上優化

Wav2vec2 Base Toy Train Data Random Noise 0.1

基於facebook/wav2vec2-base模型在隨機噪聲數據集上微調的語音識別模型

Wav2vec2 Base Demo Colab

基於facebook/wav2vec2-base微調的語音識別模型，在特定數據集上訓練，詞錯誤率(WER)為0.3391。

Xls R Kyrgiz Cv8

該模型是基於facebook/wav2vec2-xls-r-300m在Common Voice 8.0吉爾吉斯語數據集上微調的自動語音識別模型

Transformers 其他

Wav2vec2 Base Demo Colab

該模型是基於facebook/wav2vec2-base進行微調的語音識別模型，在Colab環境下訓練完成

Wav2vec2 Random

基於TIMIT_ASR數據集對wav2vec2-base-random模型進行微調的自動語音識別模型

patrickvonplaten

Wav2vec2 Xls R 300m Wolof Lm

這是一個基於facebook/wav2vec2-xls-r-300m微調的沃洛夫語自動語音識別模型，旨在解決沃洛夫語資源匱乏的問題。

Transformers 其他

Sew Tiny Portuguese Cv8

這是一個基於SEW-tiny架構的葡萄牙語自動語音識別模型，在Common Voice 8數據集上微調，適用於葡萄牙語語音識別任務。

Transformers 其他

Wav2vec2 Xls R 300m Italian Robust

基於facebook/wav2vec2-xls-r-300m在多個意大利語語音數據集上微調的自動語音識別模型

Transformers 其他

Wav2vec2 Georgian Daytona

基於facebook/wav2vec2-large-xlsr-53模型微調的格魯吉亞語語音識別模型，在通用語音數據集上訓練

語音識別其他

Wav2vec2 Base Timit Demo Colab 32 Epochs30

基於facebook/wav2vec2-base微調的語音識別模型，在TIMIT數據集上訓練30輪次

Wav2vec2 Large Xlsr 53 Hsb

基於facebook/wav2vec2-large-xlsr-53模型微調的上索布語語音識別模型，支持16kHz音頻輸入

語音識別其他

Wav2vec2 Xls R 300m Gn Cv8

這是一個基於facebook/wav2vec2-xls-r-300m模型在Common Voice 8數據集上微調的自動語音識別(ASR)模型，支持瓜拉尼語(gn)。

Transformers 其他

Wav2vec2 Large Xlsr Turkish Demo Colab

該模型是基於facebook/wav2vec2-large-xlsr-53在通用語音數據集上微調的土耳其語語音識別模型

patrickvonplaten

Wav2vec2 Xls R 300m Gl CV8

該模型是基於Facebook的wav2vec2-xls-r-300m在Common Voice加利西亞語(gl)數據集上微調的語音識別模型，在測試集上取得了20.8%的詞錯誤率(WER)。

Transformers 其他

該模型是在Common Voice 7.0 AB數據集上微調的自動語音識別模型，基於XLS-R dummy架構

Transformers 其他

Wav2vec2 Xlsr Breton

該模型是基於facebook/wav2vec2-xls-r-1b在布列塔尼語數據集上微調的自動語音識別模型。

Transformers 其他

Wav2vec2 Large Xls R 300m Br D10

這是一個基於facebook/wav2vec2-xls-r-300m在布列塔尼語數據集上微調的語音識別模型，在Common Voice 8測試集上取得了52.3%的詞錯誤率(WER)。

Transformers 其他

Wav2vec2 Xls R 300m German De

該模型是基於facebook/wav2vec2-xls-r-300m在MOZILLA-FOUNDATION/COMMON_VOICE_7_0 - DE數據集上微調的德語自動語音識別模型。

Transformers 德語

Wav2vec2 Large Xls R 300m Hsb V1

這是一個基於facebook/wav2vec2-xls-r-300m在上索布語(HSB)數據集上微調的自動語音識別模型，在Common Voice 8測試集上取得了0.4393的詞錯誤率(WER)。

Transformers 其他

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase