多場景語音轉寫

# 多場景語音轉寫

Whisper Fa Tinyyy

基於OpenAI Whisper-tiny微調的波斯語自動語音識別模型，在common_voice_11_0數據集上訓練

Transformers 其他

Whisper Large V3 Turbo Es

基於Whisper-large-v3-turbo微調的西班牙語語音識別模型，在Common Voice 17.0西班牙語數據集上詞錯誤率降低至5.34%

Transformers 西班牙語

Whisper Large V3 Turkish Test1

基於OpenAI Whisper-large-v3模型在Common Voice 17.0土耳其語數據集上微調的語音識別模型

Transformers 其他

Whisper Small Sinhala Fine Tune

基於OpenAI Whisper-small模型在僧伽羅語上進行微調的語音識別模型

Whisper Medium Et

基於約800小時多樣化愛沙尼亞語數據微調的Whisper-medium模型，適用於通用語音識別場景

Whisper Medium Turkish 2

基於OpenAI Whisper Medium微調的土耳其語語音識別模型，在Common Voice 11.0數據集上訓練

Transformers 其他

Whisper Large V2 Serbian

這是基於OpenAI Whisper Large-V2模型在塞爾維亞語Common Voice 11.0數據集上微調的語音識別模型，詞錯誤率為10.76%。

Transformers 其他

Exp W2v2t Fa Hubert S801

基於facebook/hubert-large-ll60k模型微調的波斯語自動語音識別模型，使用Common Voice 7.0波斯語數據集訓練。

Transformers 其他

Exp W2v2t Sv Se Vp Nl S842

這是一個基於facebook/wav2vec2-large-nl-voxpopuli模型微調的瑞典語自動語音識別模型，使用Common Voice 7.0 (sv-SE)數據集進行訓練。

Wav2vec2 Large Xls R 300m Pt Colab

該模型是基於facebook/wav2vec2-xls-r-300m在common_voice_9_0數據集上微調的語音識別模型，支持葡萄牙語語音轉文本任務。

Wav2vec2 Large Xls R 300m Turkish Colab

該模型是基於facebook/wav2vec2-xls-r-300m在通用語音數據集上微調的土耳其語語音識別模型

基於facebook/wav2vec2-xls-r-300m的烏克蘭語自動語音識別模型，在Common Voice 10.0數據集上訓練

Transformers 其他

Wav2vec2 Large Xls R 300m Turkish Colab

該模型是基於facebook/wav2vec2-xls-r-300m在common_voice數據集上微調的土耳其語語音識別模型

Wav2vec2 Large Xls R 300m Russian Colab Beam Search Test

該模型是基於facebook/wav2vec2-xls-r-300m在通用語音數據集上微調的俄語語音識別模型，在評估集上取得了0.468的詞錯誤率。

Wav2vec2 Large Xlsr 53 Dutch

Facebook開發的基於Wav2Vec 2.0架構的荷蘭語自動語音識別(ASR)模型，採用XLSR-53多語言預訓練模型微調

語音識別其他

Wav2vec2 Large Xls R 300m Ur

基於wav2vec2-large-xls-r-300m架構的烏爾都語語音識別模型，在common_voice數據集上微調

Wav2vec2 Xlsr Estonian

這是一個基於facebook/wav2vec2-xls-r-1b模型在愛沙尼亞語數據集上微調的自動語音識別模型。

Transformers 其他

Wav2vec2 Large Nl Voxpopuli

基於VoxPopuli語料庫荷蘭語子集預訓練的自動語音識別模型

語音識別其他

Wav2vec2 Large Xls R 300m Urdu

基於facebook/wav2vec2-xls-r-300m在Common Voice 8烏爾都語數據集上微調的語音識別模型

Transformers 其他

Wav2vec2 Large Xlsr 53 Portuguese

Facebook開發的基於Wav2Vec 2.0架構的大規模葡萄牙語自動語音識別(ASR)模型，支持葡萄牙語語音轉文本任務。

語音識別其他

Wav2vec2 Base Sv Voxpopuli

基於VoxPopuli語料庫瑞典語子集預訓練的Wav2Vec2基礎模型，適用於瑞典語語音識別任務。

Transformers 其他

Wav2vec2 Large Xls R 300m Basque

基於facebook/wav2vec2-xls-r-300m在巴斯克語Common Voice數據集上微調的自動語音識別模型

Transformers 其他

Wav2vec2 Common Voice Tr Demo

該模型是基於facebook/wav2vec2-large-xlsr-53在COMMON_VOICE SV-SE數據集上微調的自動語音識別(ASR)模型，支持瑞典語語音識別。

Wav2vec2 Base It Voxpopuli

基於VoxPopuli意大利語無標註數據預訓練的Wav2Vec2基礎模型，適用於語音識別任務。

Transformers 其他

Wav2vec2 Large Xls R 300m Spanish Custom

這是一個基於facebook/wav2vec2-xls-r-300m模型在common_voice西班牙語數據集上微調的語音識別模型，在評估集上取得了21.17%的詞錯誤率。

基於通用語音波斯語數據微調的XLS-R-300m語音識別模型

Transformers 其他

Wav2vec2 Large Xls R 300m Turkish Colab

基於facebook/wav2vec2-xls-r-300m在common_voice土耳其語數據集上微調的語音識別模型

Wav2vec2 Xlsr Georgian

該模型是基於facebook/wav2vec2-xls-r-1b在格魯吉亞語數據集上微調的自動語音識別模型

Transformers 其他

Wav2vec2 Xls R 300m Uk

這是一個基於facebook/wav2vec2-xls-r-300m模型在烏克蘭語數據集上微調的自動語音識別(ASR)模型，在Common Voice烏克蘭語測試集上取得了12.22%的詞錯誤率(WER)。

Transformers 其他

Wav2vec2 Base Turkish Cv8

這是一個基於Common Voice 8.0土耳其語數據集微調的自動語音識別(ASR)模型，能夠將土耳其語語音轉換為文本。

Transformers 其他

Wav2vec2 Large Xls R 300m Latvian

這是一個基於facebook/wav2vec2-xls-r-300m在拉脫維亞語數據集上微調的自動語音識別模型，在Common Voice 7測試集上取得了16.98%的WER。

Transformers 其他

Wav2vec2 Large Xls R 300m Bulgarian

基於facebook/wav2vec2-xls-r-300m在MOZILLA-FOUNDATION/COMMON_VOICE_7_0 - BG數據集上微調的保加利亞語語音識別模型

Transformers 其他

Wav2vec2 Large Xlsr Greek 1

基於facebook/wav2vec2-large-xlsr-53在希臘語上微調的語音識別模型，支持16kHz採樣率的語音輸入。

Transformers 其他

該模型是基於KBLab/wav2vec2-large-voxrex在NBAILAB/NPSC - 48K_MP3數據集上微調的自動語音識別模型

Wav2vec2 Large Xls R 300m Pa IN Dx1

這是一個基於facebook/wav2vec2-xls-r-300m在旁遮普語(印度)數據集上微調的自動語音識別模型

Wav2vec2 Large Xlsr 53 Frisian

這是一個基於wav2vec2-large-xlsr-53模型微調的弗里斯蘭語自動語音識別(ASR)模型，由RuudVelo開發。

Wav2vec2 Large Xls R 300m Bg V1

這是一個基於facebook/wav2vec2-xls-r-300m模型在保加利亞語語音數據集上微調的自動語音識別(ASR)模型。

Transformers 其他

Wav2vec2 Large Xls R 300m As V9

基於facebook/wav2vec2-xls-r-300m在阿薩姆語(Common Voice 8.0)數據集上微調的自動語音識別模型

Transformers 其他

Wav2vec2 Xls R 300m Cv8 Turkish

這是一個基於Facebook的wav2vec2-xls-r-300m模型在土耳其語Common Voice 8數據集上微調的自動語音識別(ASR)模型。

Transformers 其他

Wav2vec2 Large Xls R 300m Hsb V1

這是一個基於facebook/wav2vec2-xls-r-300m在上索布語(HSB)數據集上微調的自動語音識別模型，在Common Voice 8測試集上取得了0.4393的詞錯誤率(WER)。

Transformers 其他

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase