W

Whisper Telugu Medium

由vasista22開發
基於OpenAI Whisper-medium微調的泰盧固語語音識別模型,在多個公開泰盧固語ASR數據集上訓練
下載量 228
發布時間 : 12/20/2022

模型概述

該模型是針對泰盧固語優化的自動語音識別(ASR)模型,能夠將泰盧固語語音準確轉錄為文本

模型特點

多數據集訓練
融合了CSTD IIIT-H、ULCA、Shrutilipi等多個權威泰盧固語ASR數據集
高性能
在Fleurs測試集上達到9.47%的詞錯誤率(WER)
高效推理支持
提供標準transformers和whisper-jax兩種推理方案,支持GPU加速

模型能力

泰盧固語語音識別
長音頻處理(支持分塊處理)
多場景語音轉錄

使用案例

語音轉錄
會議記錄
將泰盧固語會議錄音轉為文字記錄
高準確率的轉錄文本
媒體字幕生成
為泰盧固語視頻內容自動生成字幕
同步準確的文字字幕
語音助手
泰盧固語語音交互
構建支持泰盧固語的語音助手應用
自然流暢的語音交互體驗
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase