Whisper Large V3 Persian Common Voice 17
模型概述
這是一個專門針對波斯語優化的自動語音識別模型,基於OpenAI的Whisper Large v3架構,在Mozilla Common Voice 17的波斯語子集上進行了微調。
模型特點
大規模數據訓練
使用超過25萬條波斯語語音樣本訓練,相比之前版本(8.3萬樣本)顯著提升了識別準確率
低詞錯誤率
在波斯語語音識別中實現了21.43的詞錯誤率(WER)
專業優化
專門針對波斯語特性進行了優化,提升了該語言的識別準確性和魯棒性
模型能力
波斯語語音識別
長音頻處理(支持30秒分塊)
使用案例
語音轉文字
波斯語會議記錄
將波斯語會議錄音自動轉換為文字記錄
準確率提升,詞錯誤率降低
波斯語媒體字幕生成
為波斯語視頻內容自動生成字幕
提高字幕製作效率
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98