高精度WER

# 高精度WER

Wav2vec2 Large Xlrs Korean V5

該模型是基於facebook/wav2vec2-xls-r-300m在zeroth_korean數據集上微調的韓語自動語音識別模型，詞錯誤率為0.2433。

Wav2vec2 Large Xlsr 53 Icelandic Ep30 967h

專為冰島語自動語音識別任務微調的聲學模型，基於967小時冰島語數據訓練

Transformers 其他

language-and-voice-lab

Stt Ru Fastconformer Hybrid Large Pc

這是一個用於俄語自動語音識別的FastConformer混合模型，結合了Transducer和CTC解碼器，參數規模約1.15億。

語音識別其他

Stt De Fastconformer Hybrid Large Pc

這是一個基於FastConformer架構的德語自動語音識別模型，採用轉換器和CTC混合訓練方式，參數規模約115M。

語音識別德語

Wav2vec2 Large Xlsr 53 Spanish Ep5 944h

適用於西班牙語自動語音識別的聲學模型，基於facebook/wav2vec2-large-xlsr-53微調5個週期，使用約944小時西班牙語數據。

Transformers 西班牙語

carlosdanielhernandezmena

Wav2vec2 Large Vi Vlsp2020

基於wav2vec2架構的越南語自動語音識別模型，預訓練使用1.3萬小時未標註YouTube音頻，並在250小時標註數據上微調

Transformers 其他

Stt Ru Conformer Ctc Large

這是一個用於俄語自動語音識別的大型Conformer-CTC模型，在約1636小時的俄語語音數據上訓練，具有約1.2億參數。

語音識別其他

Stt Es Conformer Ctc Large

這是一個用於西班牙語自動語音識別(ASR)的大型Conformer-CTC模型，由NVIDIA訓練併發布。

語音識別西班牙語

Stt Fr Conformer Transducer Large

這是一個用於法語自動語音識別的大規模康福默-轉換器模型，參數約1.2億，在超過1500小時的法語語音數據上訓練而成。

語音識別法語

Wav2vec2 Large 960h Lv60 Self 4 Gram Fine Tune Real 29 Jun

該模型是基於facebook/wav2vec2-large-960h-lv60-self在uob_singlish數據集上微調的語音識別模型，支持新加坡英語識別。

Stt Fr Conformer Ctc Large

這是一個基於Conformer架構的法語自動語音識別(ASR)大模型，採用CTC損失函數，在超過1500小時的法語語音數據上訓練而成。

語音識別法語

Ai Light Dance Stepmania Ft Wav2vec2 Large Xlsr 53

該模型是基於facebook/wav2vec2-large-xlsr-53在GARY109/AI_LIGHT_DANCE - ONSET-STEPMANIA2數據集上微調的自動語音識別模型

Wav2vec2 Large Multilang Cv Ru

該模型是基於facebook/wav2vec2-large-xlsr-53在common_voice數據集上微調的版本，主要用於俄語語音識別任務。

Assignment1 Maria

s2t-small-librispeech-asr 是一個用於自動語音識別（ASR）的語音到文本轉換器（S2T）模型，基於序列到序列的轉換器架構。

Transformers 英語

Classroom-workshop

Assignment1 Joane

一個用於自動語音識別(ASR)的語音到文本轉換器(S2T)模型

Transformers 英語

Classroom-workshop

Assignment1 Jack

一個用於自動語音識別(ASR)的語音到文本轉換器(S2T)模型，基於序列到序列轉換器架構

Transformers 英語

Classroom-workshop

Assignment1 Jane

s2t-small-librispeech-asr 是一個用於自動語音識別（ASR）的語音到文本轉換器（S2T）模型，基於序列到序列轉換器架構。

Transformers 英語

Classroom-workshop

Assignment1 Omar

Wav2Vec2是一個基於自監督學習的語音識別模型，在LibriSpeech 960小時語音數據上預訓練和微調，支持英語語音轉錄。

Transformers 英語

Classroom-workshop

Wav2vec2 Large Xls R 300m Singlish Colab

基於facebook/wav2vec2-xls-r-300m在新加坡英語(li_singlish)數據集上微調的語音識別模型

Ai Light Dance Singing Ft Wav2vec2 Large Lv60 V2

該模型是基於wav2vec2-large-lv60在ONSET-SINGING數據集上微調的自動語音識別模型，專注於歌唱語音識別任務。

Dansk Wav2vec21

該模型是基於Siyam/SKYLy在common_voice數據集上微調得到的丹麥語語音識別模型

English Filipino Wav2vec2 L Xls R Test 02

這是一個基於wav2vec2-large-xlsr-53-english模型在菲律賓語音數據集上微調的語音識別模型，支持英語和菲律賓語的語音轉文本任務。

Wav2vec2 Common Voice Lithuanian

該模型是基於facebook/wav2vec2-large-xlsr-53在COMMON_VOICE - LT數據集上微調的版本，用於立陶宛語語音識別。

Transformers 其他

20220413 210552

該模型是基於facebook/wav2vec2-xls-r-300m在common_voice數據集上微調的語音識別模型

Aradia Ctc Distilhubert Ft

基於distilhubert在阿拉伯語語音數據集上微調的自動語音識別(ASR)模型

Wav2vec2 Large Xls R 300m Irish Colab Test

這是一個基於facebook/wav2vec2-xls-r-300m模型在common_voice愛爾蘭語數據集上微調的語音識別模型，主要用於愛爾蘭語的自動語音識別任務。

Wav2vec2 Xls R 1b English

這是一個基於XLS-R 1B架構的英語語音識別模型，在多個英語語音數據集上進行了微調。

Transformers 英語

S2t Large Librispeech Asr

一個用於自動語音識別(ASR)的端到端序列到序列轉換器模型，基於LibriSpeech數據集訓練

Transformers 英語

Wav2vec2 Large Xls R 300m Ur

基於wav2vec2-large-xls-r-300m架構的烏爾都語語音識別模型，在common_voice數據集上微調

Wav2vec2 Xls R 1b Hi Cv8

這是一個基於facebook/wav2vec2-xls-r-1b模型在Common Voice 8.0印地語數據集上微調的自動語音識別模型，支持印地語語音轉文本任務。

Transformers 其他

Wav2vec2 Xls R 1b Italian

這是一個基於XLS-R 1B架構的意大利語自動語音識別模型，在多個意大利語數據集上進行了微調

Transformers 其他

Wav2vec2 Speechdat

該模型是基於facebook/wav2vec2-large-xlsr-53在COMMON_VOICE - SV-SE數據集上微調的瑞典語自動語音識別模型。

Wav2vec2 Large Xls R 300m Irish

該模型是基於facebook/wav2vec2-xls-r-300m在愛爾蘭語數據集上微調的自動語音識別(ASR)模型

Wav2vec2 Large Xls R 300m Hindi Colab

該模型是基於facebook/wav2vec2-xls-r-300m在common_voice數據集上微調的版本，用於印地語語音識別任務。

Wav2vec2 Xlsr Czech

該模型是基於facebook/wav2vec2-xls-r-1b在MOZILLA-FOUNDATION/COMMON_VOICE_8_0 - cs數據集上微調得到的捷克語自動語音識別模型。

Transformers 其他

Wav2vec2 Large Xlsr 53 Ir

基於wav2vec2-large-xlsr-53微調的愛爾蘭蓋爾語自動語音識別模型，在Common Voice 7.0數據集上訓練

Wav2vec2 Xls R 1b Portuguese

這是一個基於XLS-R 1B架構的葡萄牙語自動語音識別模型，在多個葡萄牙語語音數據集上進行了微調。

Transformers 其他

Wav2vec2 Large Xls R 300m Irish Colab

基於facebook/wav2vec2-xls-r-300m在common_voice數據集上微調的愛爾蘭語語音識別模型

Wav2vec2 Xlsr Basaa

該模型是基於facebook/wav2vec2-xls-r-1b在Common Voice 8巴薩語數據集上微調得到的自動語音識別模型。

Transformers 其他

Wav2vec2 Xl 960h Dementiabank

該模型是基於facebook/wav2vec2-large-960h在DementiaBank數據集上微調的語音識別模型，主要用於語音轉文本任務。

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase