Whisper Large V3 Turbo
基於OpenAI Whisper Large v3 Turbo模型針對希伯來語進行微調的自動語音識別模型
Downloads 988
Release Time : 2/9/2025
Model Overview
本模型是專為希伯來語優化的自動語音識別(ASR)模型,適用於希伯來語音頻轉錄場景。
Model Features
希伯來語優化
專門針對希伯來語進行微調,提高希伯來語音頻轉錄準確性
多數據集訓練
使用三個不同來源的希伯來語數據集進行訓練,覆蓋多種語音場景
高效訓練
採用混合精度訓練和優化超參數,在8卡A40上僅需9小時完成訓練
Model Capabilities
希伯來語音頻轉錄
語音識別
Use Cases
政府會議記錄
以色列議會會議轉錄
用於轉錄以色列議會全體會議的希伯來語內容
訓練數據中包含約325小時議會會議記錄
眾包轉錄
公開音頻源轉錄
用於轉錄各種公開來源的希伯來語音頻
訓練數據中包含約300小時眾包轉錄數據
教育應用
維基百科內容朗讀轉錄
用於轉錄希伯來語維基百科內容的朗讀音頻
訓練數據中包含約50小時眾包錄音數據
Featured Recommended AI Models
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers Supports Multiple Languages

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers English

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 Chinese
R
uer
2,694
98