W

Whisper Hindi2Hinglish Prime

由Oriserve開發
基於Whisper架構優化的印地語-印英混合語自動語音識別模型,支持噪聲環境下的高精度轉錄
下載量 1,812
發布時間 : 1/7/2025

模型概述

該模型是專為印度口音設計的語音識別系統,能夠將印地語和印英混合語(Hinglish)的音頻準確轉錄為文本,特別優化了噪聲環境下的識別能力和幻聽抑制功能

模型特點

印英混合語支持
新增將音頻轉錄為口語化印英混合語的能力,減少語法錯誤
抗噪能力增強
針對印度本土高噪聲環境優化,顯著提升噪聲場景下的識別準確率
幻聽抑制
通過特殊訓練策略大幅降低語音識別中的幻聽現象
性能提升
相比原始Whisper模型,在基準測試集上平均性能提升約39%
印度口音適配
使用550小時印度口音數據進行微調,特別適應印度本土語音特徵

模型能力

印地語語音識別
印英混合語轉錄
噪聲環境語音處理
長音頻分段處理
多說話人識別

使用案例

語音轉錄服務
客服通話記錄轉錄
將印度地區客服中心的印英混合語通話轉錄為文本
在噪聲環境下WER降低至32.43%
教育內容字幕生成
為印度本土教育視頻自動生成字幕
支持印地語和印英混合語的雙語字幕
語音助手
印度方言語音助手
支持印度用戶使用印英混合語與語音助手交互
準確理解口語化表達
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase