W

Whisper Large V3 Ft Cv16 Mn

由sanchit-gandhi開發
基於OpenAI Whisper Large V3模型在Common Voice 16.0數據集上微調的語音識別模型
下載量 34
發布時間 : 1/22/2024

模型概述

該模型是OpenAI Whisper Large V3的微調版本,專注於自動語音識別(ASR)任務,在Common Voice數據集上取得了35.22%的詞錯誤率。

模型特點

高精度語音識別
在Common Voice測試集上取得35.22%的詞錯誤率,表現優異
多語言支持
基於Whisper架構,具備處理多種語言的能力
高效微調
在基礎模型上進行針對性訓練,提升特定領域的識別準確率

模型能力

語音轉文本
多語言語音識別
長音頻處理

使用案例

語音轉錄
會議記錄自動生成
將會議錄音自動轉換為文字記錄
準確率約65%(基於WER指標推斷)
播客字幕生成
為播客內容自動生成字幕
輔助技術
聽力障礙輔助
即時語音轉文字輔助聽障人士
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase