W

Whisper Medium Vaani Telugu

由ARTPARK-IISc開發
基於OpenAI Whisper-small架構的泰盧固語自動語音識別模型,由ARTPARK-IISc團隊針對印度語言優化
下載量 26
發布時間 : 12/1/2024

模型概述

該模型是Whisper-small的變體,專門針對泰盧固語進行優化,用於將泰盧固語語音轉換為文本

模型特點

泰盧固語優化
針對泰盧固語語音特點進行專門優化的自動語音識別模型
基於Whisper架構
採用OpenAI Whisper-small的成熟Transformer架構,具有穩定的語音識別能力
16kHz音頻支持
支持標準16kHz採樣率的音頻輸入,符合Whisper模型規範

模型能力

泰盧固語語音識別
語音轉文本
自動語音轉錄

使用案例

語音轉錄
泰盧固語會議記錄
將泰盧固語會議錄音自動轉換為文字記錄
提高會議記錄效率,減少人工轉錄時間
語音助手開發
用於開發支持泰盧固語的語音助手應用
實現泰盧固語語音指令識別
教育
語言學習工具
幫助學習者檢查泰盧固語發音準確性
提供即時語音反饋
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase