K

Kb Whisper Large

由KBLab開發
瑞典國家圖書館發佈的基於Whisper架構的瑞典語語音識別模型,訓練數據超過5萬小時,顯著降低詞錯誤率。
下載量 8,880
發布時間 : 2/14/2025

模型概述

專為瑞典語優化的語音識別模型,基於OpenAI Whisper架構,在多個瑞典語數據集上表現優異。

模型特點

顯著降低詞錯誤率
相比OpenAI原版模型,在瑞典語識別上平均降低47%的詞錯誤率(WER)
多格式支持
提供Hugging Face、whisper.cpp(GGML)、onnx和ctranslate2多種格式的模型檢查點
多版本轉錄風格
提供三種轉錄風格版本:字幕版(簡潔)、標準版(默認)和嚴格版(逐字逐句)
大規模訓練數據
基於超過5萬小時的瑞典語音數據訓練,分兩個質量階段進行訓練

模型能力

瑞典語語音識別
帶時間戳的語音轉錄
多格式推理支持
批處理語音轉錄

使用案例

語音轉錄
會議記錄轉錄
將瑞典語會議錄音轉換為文字記錄
高準確率的轉錄文本
字幕生成
為瑞典語視頻內容生成字幕
帶時間戳的字幕文件
語音分析
語音內容分析
分析瑞典語語音內容進行後續處理
結構化文本數據
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase