V

Vegam Whisper Medium Ml

由smcproject開發
這是將thennal/whisper-medium-ml轉換為CTranslate2模型格式的版本,用於馬拉雅拉姆語語音識別
下載量 83
發布時間 : 5/19/2023

模型概述

該模型是基於Whisper架構的馬拉雅拉姆語自動語音識別(ASR)模型,轉換為CTranslate2格式以提高推理速度

模型特點

高效推理
轉換為CTranslate2格式,支持使用faster-whisper進行快速推理
多數據集訓練
基於google/fleurs、thennal/IMaSC和mozilla-foundation/common_voice_11_0等多個數據集訓練
多精度支持
支持FP16和INT8等多種計算精度,可在不同硬件上優化性能

模型能力

馬拉雅拉姆語語音識別
音頻轉文本
多精度推理

使用案例

語音轉錄
音頻文件轉錄
將馬拉雅拉姆語語音文件轉換為文本
示例中展示了準確的語音識別結果
語音處理應用
語音助手
用於開發馬拉雅拉姆語語音助手
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase