W

Whisper Base.kk

由akuzdeuov開發
Whisper-base是針對低資源哈薩克語的自動語音識別(ASR)模型,在哈薩克語音語料庫2上微調,包含超過1千小時的標註數據。
下載量 43
發布時間 : 8/14/2024

模型概述

這是一個僅支持哈薩克語的語音識別模型,基於Whisper架構,專為哈薩克語語音轉文本任務優化。

模型特點

低資源語言優化
專門針對哈薩克語這類低資源語言進行優化,在有限數據下實現良好性能
工業級語料訓練
使用超過1千小時的工業級哈薩克語音語料庫(KSC2)進行訓練
長音頻處理
支持通過分塊算法處理任意長度的音頻輸入

模型能力

哈薩克語語音識別
長音頻轉錄
批量語音處理

使用案例

語音轉錄
哈薩克語會議記錄
將哈薩克語會議錄音自動轉錄為文字記錄
測試集WER 15.36%
媒體內容字幕生成
為哈薩克語視頻內容自動生成字幕
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase