低詞錯誤率

# 低詞錯誤率

Phi 4 Mm Inst Asr Singlish

針對新加坡英語優化的多模態語音識別模型，基於微軟Phi-4多模態指令模型微調，顯著提升對新加坡英語獨特語音特徵的識別能力。

音頻生成文本

Transformers 支持多種語言

Wav2vec2 Base Librispeech Demo Colab

該模型是基於facebook/wav2vec2-base在LibriSpeech數據集上微調的語音識別模型，在評估集上取得了0.3174的詞錯誤率。

Hubert Base Librispeech Demo Colab

基於facebook/hubert-large-ls960-ft微調的語音識別模型，在LibriSpeech數據集上訓練

Whisper Small Vi

基於openai/whisper-small針對越南語語音數據微調的自動語音識別模型，提升越南語轉錄準確性和魯棒性

Transformers 其他

Whisper Large V3 French Distil Dec16 Ct2

這是Whisper Large V3的法語蒸餾版本，專為法語自動語音識別優化，通過ctranslate2實現高效推理。

語音識別法語

W2v Bert 2.0 Naijavoices Clearglobal Hausa 500hr V0

基於facebook/w2v-bert-2.0微調的豪薩語語音識別模型，在500小時豪薩語數據上訓練，詞錯誤率7.47%

Whisper Persian Turbooo

基於OpenAI Whisper-large-v3-turbo優化的波斯語自動語音識別模型，支持醫療領域應用

Transformers 其他

Whisper Base Vi

基於openai/whisper-base模型在100小時越南語語音數據上微調的語音識別模型，提升越南語轉錄準確性

Transformers 其他

Whisper Large V3 Persian Common Voice 17

基於Whisper Large v3微調的波斯語自動語音識別模型，使用Common Voice 17數據集訓練，顯著提升了波斯語識別準確率。

Transformers 其他

Whisper Large V3 Vaani Hindi

基於OpenAI的Whisper-Large-V3模型微調的印地語語音識別模型，訓練數據包含約718小時的印地語轉錄語音

Indian Accent English Whisper Finetuned Epoch 15

基於OpenAI Whisper-large-v3-turbo微調的印度英語口音語音識別模型，在印度英語口音數據集上取得7.99%的詞錯誤率

Transformers 英語

Wav2vec2 Large Xlsr 53 Hungarian

基於facebook/wav2vec2-large-xlsr-53在匈牙利語Common Voice數據集上微調的自動語音識別模型

Transformers 其他

Whisper Small Fr

這是一個基於法語數據集微調的Whisper-small語音識別模型，詞錯誤率相比基線模型降低了6.793個百分點。

Transformers 法語

Lite Whisper Large V3 Turbo Acc

Lite-Whisper 是採用 LiteASR 技術壓縮的 OpenAI Whisper 輕量版本，在保持高準確率的同時減小模型大小。

efficient-speech

基於OpenAI Whisper Medium模型微調的烏茲別克語自動語音識別模型

Transformers 其他

Whisper Finetuned

基於Whisper-large-v3-turbo微調的印度英語口音語音識別模型，詞錯誤率4.39%

Transformers 英語

Kb Whisper Small

瑞典國家圖書館發佈的Whisper模型，專為瑞典語優化，在50,000+小時瑞典語音數據上訓練，性能超越OpenAI原版

Transformers 其他

Kb Whisper Medium

瑞典國家圖書館發佈的基於超過5萬小時瑞典語音訓練的Whisper模型，在瑞典語音識別任務上表現優異

Transformers 其他

Kb Whisper Large

瑞典國家圖書館發佈的基於Whisper架構的瑞典語語音識別模型，訓練數據超過5萬小時，顯著降低詞錯誤率。

Transformers 其他

Quran Whisper Base Fine Tune

該模型是基於openai/whisper-base在quran-ayat-speech-to-text數據集上微調的阿拉伯語語音識別模型，專注於古蘭經經文的語音轉文字任務。

Transformers 阿拉伯語

Whisper Large V3 Turbo STT Zeroth KO V2

基於Whisper Large v3 Turbo優化的韓語自動語音識別模型，提供高準確率且帶時間戳的轉寫結果

Transformers 韓語

Chunkformer Large Vie

基於ChunkFormer架構的大規模越南語自動語音識別模型，在約3000小時的越南語公開語音數據上微調，性能優異。

語音識別其他

Whisper Finetuned Amharic

基於openai/whisper-small微調的阿姆哈拉語語音識別模型，在評估集上詞錯誤率為2.0538%

Wav2vec2 Large Xls R 300m Ru

該模型是基於facebook/wav2vec2-xls-r-300m在common_voice_17_0數據集上微調的俄語自動語音識別(ASR)模型，詞錯誤率(WER)為0.195。

Whisper Small Tajik

基於OpenAI Whisper-small微調的塔吉克語自動語音識別模型，在Google Fleurs數據集上訓練，詞錯誤率24.26%。

Transformers 其他

Audiox South V1

AudioX是由Jivi AI開發的多語言自動語音識別模型，專門針對印度南方語言優化，支持泰米爾語、泰盧固語、卡納達語和馬拉雅拉姆語。

語音識別其他

Whisper Large V3 Turbo Shqip

基於OpenAI Whisper Large v3 Turbo針對阿爾巴尼亞語優化的語音識別模型，支持標準阿爾巴尼亞語及蓋格方言

Transformers 其他

Whisper Small For Quran

基於OpenAI Whisper-small微調的古蘭經語音識別模型，專為阿拉伯語古蘭經音頻設計

Transformers 阿拉伯語

German RAG WHISPER LARGE V3 TURBO HESSIAN AI

基於Whisper Large v3 Turbo優化的德語語音識別模型，在13小時精選數據集上微調，顯著提升德語識別準確率

Transformers 德語

基於Whisper Base微調的烏茲別克語語音識別模型，在Common Voice數據集上訓練

Transformers 其他

Whisper Khanacademy Large V3 Turbo Tr

基於OpenAI Whisper-large-v3-turbo模型在土耳其語可汗學院數據集上微調的自動語音識別(ASR)模型

Transformers 其他

Voice Clone Large Finetune Final

該模型是基於openai/whisper-large-v3微調的語音克隆模型，主要用於語音識別任務，在評估集上詞錯誤率為15.3572。

Whisper Tiny German 1224

基於Whisper架構優化的德語語音識別模型，參數量3900萬，支持高效德語語音轉錄

Transformers 德語

Whisper Large V3 Turbo German Ct2

基於 Whisper Large v3 的德語語音識別模型，專為德語語音處理和識別優化

Transformers 德語

Whisper Large V3 Turbo Common Voice 19 0 Zh TW

基於OpenAI Whisper-large-v3-turbo微調的繁體中文（臺灣）自動語音識別模型

Transformers 中文

Pathumma Whisper Th Large V3

Pathumma Whisper Large V3 是一個基於 OpenAI Whisper 架構的泰語自動語音識別模型，支持泰語和英語的語音轉錄任務。

Transformers 支持多種語言

Whisper Large V3 Lv Late Cv19

基於whisper-large-v3微調的拉脫維亞語自動語音識別模型，由AiLab.lv訓練，支持拉脫維亞語語音轉文本任務。

語音識別其他

Whisper Base Hungarian V1

基於OpenAI Whisper-base模型微調的匈牙利語語音識別模型，在1200小時匈牙利語數據上訓練，表現優於同類模型

Transformers 其他

Whisper Large V3 Turbo Turkish

基於openai/whisper-large-v3-turbo在Common Voice 17.0數據集上微調的土耳其語語音識別模型

Transformers 其他

Whisper Large V3 Turbo Es

基於Whisper-large-v3-turbo微調的西班牙語語音識別模型，在Common Voice 17.0西班牙語數據集上詞錯誤率降低至5.34%

Transformers 西班牙語

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase