Whisper Large V3 Japanese 4k Steps Ct2
模型概述
基於Whisper large-v3的語音識別模型,轉換為CTranslate2格式以提高推理效率,支持多語言語音轉文字任務。
模型特點
高效推理
轉換為CTranslate2格式後,推理速度比原始PyTorch實現更快
多語言支持
支持超過100種語言的語音識別
日語優化
專門針對日語進行了4000步的額外訓練
FP16量化
模型權重以FP16格式保存,可在加載時調整計算精度
模型能力
語音轉文字
多語言語音識別
音頻轉錄
使用案例
媒體轉錄
播客轉錄
將播客音頻內容自動轉錄為文字
高準確率的轉錄結果,支持多語言
視頻字幕生成
為視頻內容自動生成字幕
支持多種語言的字幕生成
會議記錄
會議錄音轉錄
將會議錄音自動轉換為文字記錄
提高會議記錄效率,便於後續檢索
語言學習
語言學習輔助
幫助語言學習者練習聽力和發音
提供準確的語音識別反饋
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98