W

Whisper Medium Fleurs Lang Id

由sanchit-gandhi開發
基於OpenAI Whisper-medium微調的語音語種識別模型,在FLEURS數據集上達到88.05%準確率
下載量 590.30k
發布時間 : 2/23/2023

模型概述

該模型專門用於語音語種識別任務,能夠準確識別音頻片段所屬的語言類別

模型特點

高準確率語種識別
在FLEURS評估集上達到88.05%的識別準確率
基於Whisper架構
基於OpenAI強大的Whisper-medium模型微調,繼承了其優秀的語音處理能力
多GPU訓練優化
採用多GPU分佈式訓練,配合梯度累積技術提高訓練效率

模型能力

語音語種識別
音頻分類

使用案例

語音處理
多語言語音分類
自動識別音頻片段所屬的語言類別
88.05%的識別準確率
語音內容預處理
為語音識別系統預先識別語言類型
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase