通用語音數據集

# 通用語音數據集

Wav2vec2 Base Cv 10000

基於wav2vec2-base-cv在通用語音數據集上微調的語音識別模型，在評估集上取得了36.84%的詞錯誤率。

Wav2vec2 Xls R 300m Hy AM CV8 V1

基於facebook/wav2vec2-xls-r-300m在通用語音數據集上微調的語音識別模型

Wav2vec2 Base Checkpoint 14

基於wav2vec2架構的語音識別模型，在通用語音數據集上微調

Wav2vec2 Xlsr Punjabi

基於facebook/wav2vec2-large-xlsr-53模型，使用通用語音數據集對旁遮普語進行微調的自動語音識別模型

Wav2vec2 Large Xlsr Frisian

這是一個基於facebook/wav2vec2-large-xlsr-53模型在弗里斯蘭語上進行微調的自動語音識別模型，使用通用語音數據集訓練。

Wav2vec2 Large Xlsr Punjabi

這是一個基於facebook/wav2vec2-large-xlsr-53模型在旁遮普語語音數據上微調的自動語音識別(ASR)模型。

Wav2vec2 Xls R 300m Es

該模型是基於facebook/wav2vec2-xls-r-300m在COMMON_VOICE - ES數據集上微調的西班牙語自動語音識別模型。

Transformers 西班牙語

Wav2vec2 Large Xlsr 53 Chuvash

基於facebook/wav2vec2-large-xlsr-53模型微調的楚瓦什語自動語音識別模型，在通用語音數據集上訓練，詞錯誤率為40.01%。

語音識別其他

基於COMMON_VOICE - FA數據集微調的波斯語自動語音識別模型

Transformers 其他

Base Spanish Asr

基於通用語音數據集訓練的西班牙語語音識別模型，採用wav2vec2架構

Wav2vec2 Xls R 300m Zh CN

該模型是基於facebook/wav2vec2-xls-r-300m在通用語音數據集ZH-CN上微調的自動語音識別(ASR)模型，支持中文普通話識別。

Transformers 其他

Wav2vec2 Large Xlsr Mongolian

基於facebook/wav2vec2-large-xlsr-53在通用語音數據集上對蒙古語進行微調的自動語音識別模型

Transformers 其他

Wav2vec2 Large Xlrs Estonian

這是一個基於facebook/wav2vec2-large-xlsr-53模型在愛沙尼亞語通用語音數據集上微調的自動語音識別(ASR)模型。

語音識別其他

Wav2vec2 Large Xlsr Hu

這是一個基於facebook/wav2vec2-large-xlsr-53模型微調的匈牙利語自動語音識別(ASR)模型，使用通用語音數據集訓練。

語音識別其他

Wav2vec2 Large Xlsr Portuguese

基於Facebook的wav2vec2-large-xlsr-53架構微調的葡萄牙語自動語音識別模型，在通用語音數據集上訓練，詞錯誤率13.77%。

語音識別其他

Wav2vec Tr Lite AG

這是一個基於XLSR Wav2Vec2架構的土耳其語自動語音識別模型，在通用語音土耳其語數據集上訓練

語音識別其他

Wav2vec2 Large Xlsr Luganda

基於facebook/wav2vec2-large-xlsr-53模型微調的盧幹達語語音識別模型，在通用語音數據集上訓練，詞錯誤率29.52%

語音識別其他

Wav2vec2 Xlsr Multilingual 56

這是一個支持56種語言的多語言自動語音識別(ASR)模型，基於facebook/wav2vec2-large-xlsr-53在通用語音數據集上微調而成。

Transformers 支持多種語言

Wav2vec2 Large Xls R 300m Spanish Small

這是一個基於wav2vec2架構的西班牙語語音識別模型，在通用語音數據集上進行了微調，詞錯誤率(WER)為0.2105。

Xlsr Wav2vec English

基於facebook/wav2vec2-large在通用語音數據集上進行英語微調的自動語音識別模型，支持16kHz採樣率的語音輸入。

Transformers 英語

Wav2vec2 10july

這是一個基於XLSR Wav2Vec2架構的德語自動語音識別模型，在通用語音德語數據集上進行了微調。

Transformers 德語

Wav2vec2 Large Xlsr Mongolian

基於facebook/wav2vec2-large-xlsr-53在蒙古語通用語音數據集上微調的自動語音識別模型

語音識別其他

Wav2vec2 Large Xlsr 53 Hsb

基於facebook/wav2vec2-large-xlsr-53模型微調的上索布語語音識別模型，支持16kHz音頻輸入

語音識別其他

Wav2vec2 Xls R 300m Urdu

Facebook的3億參數語音識別模型，針對烏爾都語進行微調，基於通用語音8.0烏爾都語數據集訓練

Wav2vec2 Large Xlsr Swedish

這是一個基於XLSR-53架構的瑞典語自動語音識別模型，在通用語音數據集上進行微調。

語音識別其他

Wav2vec2 Large Xlsr 53 Sah CV8

基於facebook/wav2vec2-large-xlsr-53在通用語音雅庫特語數據集上微調的語音識別模型

Transformers 其他

Wav2vec2 Large Xlsr Kinyarwanda Apostrophied

基於facebook/wav2vec2-large-xlsr-53在盧旺達語上的微調模型，支持預測標記代詞與元音開頭單詞縮寫的撇號

語音識別其他

Wav2vec2 Large Xlsr 53 Vietnamese

基於facebook/wav2vec2-large-xlsr-53模型微調的越南語自動語音識別模型，使用通用語音數據集訓練。

語音識別其他

Wav2vec2 Cv Coral 30ep

基於Facebook的wav2vec2-large-xlsr-53模型微調的葡萄牙語語音識別模型，在通用語音數據集上訓練

語音識別其他

Wav2vec2 Large Xlsr Finnish

這是一個基於facebook/wav2vec2-large-xlsr-53在芬蘭語上微調的自動語音識別模型，使用通用語音數據集進行訓練。

語音識別其他

Wav2vec2 Large Xls R 300m Spanish Small

基於wav2vec2-large-xls-r-300m架構的西班牙語語音識別模型，在通用語音數據集上微調，詞錯誤率(WER)為0.1791

Wav2vec2 Large Xls R 300m Greek

基於通用語音數據集訓練的希臘語語音識別模型，採用wav2vec2架構

Wav2vec2 Large Xls R 300m Turkish Colab

基於facebook/wav2vec2-xls-r-300m在通用語音數據集上微調的土耳其語語音識別模型

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase