魯棒語音處理

# 魯棒語音處理

Wav2vec2 Large Robust 6 Ft Age Gender Finetuned Gtzan

基於wav2vec2架構的音頻分類模型，在privateSLI數據集上微調，用於年齡和性別識別任務

languageresearch

Wav2vec2 Xls R 300m Lm Hebrew

基於facebook/wav2vec2-xls-r-300m微調的希伯來語語音識別模型，添加了n-gram語言模型增強

Transformers 其他

Wav2vec2 Xls R 1b De Cv8

基於facebook/wav2vec2-xls-r-1b在Common Voice 8德語數據集上微調的自動語音識別模型

Transformers 德語

這是一個基於facebook/wav2vec2-xls-r-300m模型在Common Voice 8迪維希語數據集上微調的自動語音識別模型

Transformers 其他

Wav2vec2 Large Xls R 300m Romansh Sursilvan

基於facebook/wav2vec2-xls-r-300m在羅曼什語蘇塞爾瓦方言數據集上微調的自動語音識別模型

這是一個基於facebook/wav2vec2-xls-r-2b模型微調的泰盧固語自動語音識別(ASR)模型，在OpenSLR SLR66數據集上訓練

Transformers 其他

Xls R 300 Sv Cv7

這是一個基於facebook/wav2vec2-xls-r-300m在瑞典語Common Voice 7.0數據集上微調的自動語音識別模型

Transformers 其他

patrickvonplaten

Wav2vec2 Xls R 300m Italian Robust

基於facebook/wav2vec2-xls-r-300m在多個意大利語語音數據集上微調的自動語音識別模型

Transformers 其他

Wav2vec2 Xls R Pt Cv7 From Bp400h

這是一個基於wav2vec2 XLS-R架構的葡萄牙語自動語音識別(ASR)模型，在Common Voice 7數據集上微調，在測試集上取得12.13%的詞錯誤率(WER)。

Transformers 其他

Wav2vec2 Indonesian Javanese Sundanese

這是一個支持印尼語、爪哇語和巽他語的多語種語音識別模型，基於facebook/wav2vec2-large-xlsr-53微調而成。

Transformers 其他

Wav2vec2 Large Xls R 1b Indonesian

基於facebook/wav2vec2-xls-r-1b在Common Voice印尼語數據集上微調的自動語音識別模型

Transformers 其他

Wav2vec2 Xls R 1b Japanese

該模型是基於facebook/wav2vec2-xls-r-1b在公共日語語音數據集上進行微調的版本，支持日語自動語音識別任務。

Transformers 日語

Wav2vec2 Large Xls R 300m Hindi

這是一個基於facebook/wav2vec2-xls-r-300m模型在印地語數據集上微調的語音識別模型，支持印地語語音轉文本任務。

Transformers 其他

Wav2vec2 Base Turkish

該模型是基於Common Voice土耳其語數據集微調的Wav2Vec2語音識別模型，在土耳其語自動語音識別任務上表現優異。

Transformers 其他

Wav2vec2 Large Xlsr Coraa Portuguese Cv7

基於Edresson/wav2vec2-large-xlsr-coraa-portuguese在common_voice數據集上微調的葡萄牙語語音識別模型

Transformers 其他

Wav2vec2 Xls R 300m Indonesian

基於Facebook的XLS-R-300M模型在印度尼西亞語語音數據上微調的自動語音識別模型

Transformers 其他

Wav2vec2 Large Xls R 300m Latvian

這是一個基於facebook/wav2vec2-xls-r-300m在拉脫維亞語數據集上微調的自動語音識別模型，在Common Voice 7測試集上取得了16.98%的WER。

Transformers 其他

Wav2vec2 Xls R 1b Korean

該模型是基於facebook/wav2vec2-xls-r-1b在KRESNIK/ZEROTH_KOREAN - CLEAN數據集上微調的韓語自動語音識別模型

Transformers 韓語

Wav2vec2 Xls R 300m Turkish Tr Small

這是一個基於facebook/wav2vec2-xls-r-300m模型在通用語音數據集上微調的土耳其語語音識別模型

Wav2vec2 Large Xlsr 53 Demo Colab

該模型是基於facebook/wav2vec2-large-xlsr-53在common_voice數據集上微調得到的語音識別模型，主要用於魯棒語音事件識別。

Wav2vec2 Large Xlsr 53 Demo Colab

這是一個基於wav2vec2架構的自動語音識別模型，專門針對泰米爾語進行優化，支持尼泊爾語語音識別任務。

Transformers 其他

Wav2vec2 Large Xls R 300m Br D2

基於facebook/wav2vec2-xls-r-300m在布列塔尼語(Common Voice 8.0)上微調的語音識別模型

Transformers 其他

該模型是基於facebook/wav2vec2-xls-r-300m在加利西亞語數據集上微調的自動語音識別模型，在Common Voice 8.0測試集上取得了11.31%的WER。

Transformers 其他

Wav2vec2 Xls R 300m German De

該模型是基於facebook/wav2vec2-xls-r-300m在MOZILLA-FOUNDATION/COMMON_VOICE_7_0 - DE數據集上微調的德語自動語音識別模型。

Transformers 德語

Wav2vec2 Large Xls R 300m Cv8 Nl

基於facebook/wav2vec2-xls-r-300m在Common Voice 8荷蘭語數據集上微調的自動語音識別模型，包含6元語法KenLM語言模型

Transformers 其他

Xls R Nl V1 Cv8 Lm

這是一個基於XLS-R架構的自動語音識別模型，專門針對荷蘭語和佛蘭芒語優化，結合了5-gram語言模型以提高識別準確率。

Transformers 其他

Xls R 2b Nl V2 Lm 5gram Os2 Hunspell

基於XLS-R的CTC模型，帶有來自Open Subtitles的5-gram語言模型，主要用於荷蘭語和佛蘭芒語的自動語音識別。

Transformers 其他

Wav2vec2 Large Xls R 300m Hi Cv8

這是一個基於facebook/wav2vec2-xls-r-300m模型在印地語Common Voice 8數據集上微調的自動語音識別(ASR)模型。

Transformers 其他

Wav2vec2 Large Xls R 300m Sat Final

這是一個基於facebook/wav2vec2-xls-r-300m在MOZILLA-FOUNDATION/COMMON_VOICE_8_0 - SAT數據集上微調的自動語音識別模型，支持Santali (Ol Chiki)語言。

Transformers 其他

Wav2vec2 Large Xls R 300m Hindi Kaggle

基於common_voice數據集訓練的印地語語音識別模型

Transformers 其他

Wav2vec2 Large Xls R 1b Cv8 Mt

基於facebook/wav2vec2-xls-r-1b在Common Voice 8馬耳他語數據集上微調的自動語音識別模型

Transformers 其他

Wav2vec2 Large Xls R 300m Sl With LM V1

這是一個基於facebook/wav2vec2-xls-r-300m模型在斯洛文尼亞語(Common Voice 8.0)數據集上微調的自動語音識別(ASR)模型，結合語言模型(LM)提升了識別效果。

Transformers 其他

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase