K

Kb Whisper Small

由KBLab開發
瑞典國家圖書館發佈的Whisper模型,專為瑞典語優化,在50,000+小時瑞典語音數據上訓練,性能超越OpenAI原版
下載量 28.61k
發布時間 : 2/14/2025

模型概述

基於OpenAI Whisper架構優化的瑞典語自動語音識別(ASR)模型,顯著降低詞錯誤率(WER),支持多種推理格式

模型特點

瑞典語優化
專門針對瑞典語進行優化訓練,詞錯誤率比OpenAI原版降低47%
多格式支持
提供Hugging Face、GGML、ONNX和ctranslate2多種推理格式
兩階段訓練
採用兩階段訓練策略,第一階段低閾值過濾,第二階段嚴格質量過濾
轉錄風格可選
提供三種轉錄風格:簡潔的字幕版、平衡的標準版和詳細的嚴格版

模型能力

瑞典語語音識別
帶時間戳的轉錄
語音內容分析
多格式推理支持

使用案例

語音轉錄
會議記錄
將瑞典語會議錄音自動轉錄為文字記錄
詞錯誤率低至6.4%(CommonVoice數據集)
媒體字幕生成
為瑞典語視頻內容自動生成字幕
支持字幕專用優化版本(revision=subtitle)
語音分析
語音內容分析
分析瑞典語語音內容並提取關鍵信息
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase