W

Whisper Large V3 Russian Ties Podlodka V1.2

由Apel-sin開發
基於TIES融合方法的俄語語音識別模型,整合了兩個Whisper-large-v3俄語變體,針對電話錄音場景優化
下載量 2,408
發布時間 : 4/2/2025

模型概述

該模型通過TIES融合方法合併了兩個俄語Whisper模型,專注於提高俄語語音識別準確率,特別優化了電話通話場景下的識別性能

模型特點

TIES融合技術
採用先進的TIES模型融合方法,稀疏密度0.9,編碼器/解碼器差異化權重分配(0.8/0.2和0.2/0.8)
電話場景優化
專門針對電話錄音場景優化,建議配合音頻預處理流程使用
多數據集訓練
融合了Common Voice 17.0、Taiga Speech、Podlodka等多個俄語語音數據集

模型能力

俄語語音轉文本
長音頻分塊處理
時間戳生成
低資源設備支持

使用案例

語音轉錄
電話錄音轉寫
將俄語電話通話內容轉換為文字記錄
針對電話音頻優化的識別準確率
會議記錄生成
自動生成俄語會議音頻的文字記錄
支持長音頻分塊處理
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase