XLSR微調

# XLSR微調

Wav2vec2 Large Chinese Zh Cn

基於XLSR-53大模型微調的中文語音識別模型，支持16kHz採樣率的語音輸入

Transformers 中文

Ai Light Dance Stepmania Ft Wav2vec2 Large Xlsr 53 V4

該模型是基於gary109/ai-light-dance_stepmania_ft_wav2vec2-large-xlsr-53-v3在GARY109/AI_LIGHT_DANCE - ONSET-STEPMANIA2數據集上微調的自動語音識別模型。

Wav2vec2 Large Ru Golos

基於facebook/wav2vec2-large-xlsr-53微調的俄語語音識別模型，使用Sberdevices Golos數據集訓練，支持16kHz音頻輸入

Transformers 其他

這是一個基於XLSR Wav2Vec2架構的印尼語自動語音識別模型，在公共語音印尼語數據集上進行了微調。

Transformers 其他

Wav2vec2 Large Xlsr Turkish Demo Colab

基於facebook/wav2vec2-large-xlsr-53模型在common_voice土耳其語數據集上微調的語音識別模型

Wav2vec2 Large Xlsr Es Col Pro Noise

基於jonatasgrosman/wav2vec2-large-xlsr-53-spanish微調的西班牙語語音識別模型，針對哥倫比亞口音和噪聲環境優化

Wav2vec2 Large Xlsr 53 Chinese Zh Cn Gpt

基於facebook/wav2vec2-large-xlsr-53在中文(zh-CN)上使用Common Voice數據集進行微調的語音識別模型

Transformers 中文

Wav2vec2 Large Xlsr Es Col Pro

基於jonatasgrosman/wav2vec2-large-xlsr-53-spanish微調的西班牙語(哥倫比亞)語音識別模型

Wav2vec2 Large Xlsr Es Col Test

這是一個基於jonatasgrosman/wav2vec2-large-xlsr-53-spanish模型在特定數據集上微調的語音識別模型，支持西班牙語。

Wav2vec2 Large Xlsr Galician

針對加利西亞語優化的自動語音識別模型，基於wav2vec2-large-xlsr-53微調，WER指標7.12

Wav2vec2hindiasr

基於Wav2Vec2架構的印地語自動語音識別(ASR)模型，在公共語音數據集上微調

基於facebook/wav2vec2-large-xlsr-53在英語通用語音數據集上微調的自動語音識別模型，支持16kHz採樣率的英語語音輸入。

語音識別英語

Wav2vec2 Large Xlsr Persian V3

基於Facebook的wav2vec2-large-xlsr-53模型在波斯語通用語音庫上微調的自動語音識別(ASR)模型

Transformers 其他

Wav2vec2 Large Xlsr Hindi Colab

基於facebook/wav2vec2-large-xlsr-53在common_voice數據集上微調的印地語語音識別模型

Wav2vec2 Large Xlsr 53 Spanish

這是一個基於facebook/wav2vec2-large-xlsr-53模型在西班牙語Common Voice數據集上微調的自動語音識別(ASR)模型。

語音識別西班牙語

Wav2vec2 Large Xlsr Kyrgyz

這是一個基於facebook/wav2vec2-large-xlsr-53模型在吉爾吉斯語通用語音數據集上微調的自動語音識別模型。

語音識別其他

基於facebook/wav2vec2-large-xlsr-53模型微調的豐語(Fon)語音識別模型，測試WER為14.97%

語音識別其他

Xlsr 53 Wav2vec Hi

基於facebook/wav2vec2-large-xlsr-53微調的印地語語音識別模型，在低資源印度語言的多語言和語碼轉換ASR挑戰賽數據上訓練

Transformers 其他

Wav2vec2 Swedish Common Voice

這是一個基於facebook/wav2vec2-large-xlsr-53模型在瑞典語Common Voice數據集上微調的語音識別模型，訓練數據量為402MB。

語音識別其他

Fine Tune XLSR Wav2Vec2 Speech2Text Vietnamese

這是一個基於MT5架構的越南語自動語音識別(ASR)修復模型，針對越南語語音識別任務進行了微調。

語音識別其他

Wav2vec2 Large Xlsr Polish

基於facebook/wav2vec2-large-xlsr-53在Common Voice波蘭語數據集上微調的語音識別模型，測試集詞錯誤率23.01%

語音識別其他

Wav2vec2 Large Xlsr Cantonese

基於Facebook的wav2vec2-large-xlsr-53模型微調的粵語語音識別模型，支持16kHz採樣率的語音輸入。

語音識別其他

Wav2vec2 Large Xlsr Kazakh

這是一個基於facebook/wav2vec2-large-xlsr-53微調的哈薩克語自動語音識別(ASR)模型，在哈薩克語音語料庫v1.1上訓練，測試WER為19.65%。

語音識別其他

Wav2vec2 Large Xlsr Javanese

基於facebook/wav2vec2-large-xlsr-53微調的爪哇語自動語音識別模型，訓練數據來自OpenSLR高質量爪哇語TTS數據。

語音識別其他

Wav2vec2 Large Xlsr 53 Tatar

基於facebook/wav2vec2-large-xlsr-53在韃靼語上微調的自動語音識別模型，支持16kHz採樣率的語音輸入。

語音識別其他

Wav2vec2 Large Xlsr 53 Th

這是一個基於wav2vec2-large-xlsr-53模型在泰語通用語音7.0數據集上微調的自動語音識別(ASR)模型。

Transformers 其他

Wav2vec2 Large Xlsr Frisian

這是一個基於facebook/wav2vec2-large-xlsr-53模型在弗里斯蘭語上進行微調的自動語音識別模型，使用通用語音數據集訓練。

Wav2vec2 Large Xlsr Punjabi

這是一個基於facebook/wav2vec2-large-xlsr-53模型在旁遮普語語音數據上微調的自動語音識別(ASR)模型。

Wav2vec2 Large Xlsr 53 Irish

基於facebook/wav2vec2-large-xlsr-53模型，使用Common Voice數據集對愛爾蘭語進行了微調的語音識別模型。

Wav2vec2 Large Xlsr Arabic

基於facebook/wav2vec2-large-xlsr-53在阿拉伯語Common Voice數據集上微調的自動語音識別模型

語音識別阿拉伯語

Wav2vec2 Large Xlsr Coraa Portuguese Cv8

基於Edresson/wav2vec2-large-xlsr-coraa-portuguese在common_voice數據集上微調的葡萄牙語語音識別模型

Wav2vec2 Large Xlsr Persian V2

基於facebook/wav2vec2-large-xlsr-53在波斯語（波斯語）上使用Common Voice數據集進行微調的自動語音識別模型

語音識別其他

Wav2vec2 Large Xlsr Tamil

基於facebook/wav2vec2-large-xlsr-53在泰米爾語上使用Common Voice數據集進行微調的自動語音識別模型。

語音識別其他

Wav2vec2 Large Xlsr Nahuatl

基於facebook/wav2vec2-large-xlsr-53微調的納瓦特爾語（ncj方言）語音識別模型

Wav2vec2 Large Xlsr Marathi

基於facebook/wav2vec2-large-xlsr-53模型微調的馬拉地語自動語音識別模型，在OpenSLR馬拉地語數據集上訓練，測試集詞錯誤率12.7%。

Transformers 其他

Wav2vec2 Xlsr Nepali

基於facebook/wav2vec2-large-xlsr-53模型微調的尼泊爾語自動語音識別模型，在OpenSLR和Common Voice數據集上訓練，測試WER為5.97%。

語音識別其他

Wav2vec2 Large Xlsr Czech

基於facebook/wav2vec2-large-xlsr-53在捷克語Common Voice數據集上微調的語音識別模型，測試WER為24.56%。

語音識別其他

Wav2vec2 Large Xlsr 53 Frisian

基於facebook/wav2vec2-large-xlsr-53模型，使用Common Voice數據集對弗里斯蘭語進行微調的自動語音識別模型。

Wav2vec2 Large Xlsr Cnh

基於facebook/wav2vec2-large-xlsr-53模型微調的哈卡欽語語音識別模型，在通用語音數據集上訓練，測試WER為31.38%。

語音識別其他

Wav2vec2 Large Xlsr 53 Ia

基於Facebook的wav2vec2-large-xlsr-53模型微調而成的國際語語音識別模型，在Common Voice國際語數據集上達到22.08%的詞錯誤率。

語音識別其他

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase