I

Indic Seamless

由ai4bharat開發
基於SeamlessM4T-v2微調的印度語言語音轉文字翻譯模型,支持13種印度語言,性能超越基礎模型及競爭系統。
下載量 917
發布時間 : 3/4/2025

模型概述

該模型專用於印度語言的語音轉文字翻譯(STT),在BhasaAnuvaad數據集上微調而成,在Fleurs數據集上創下新紀錄。

模型特點

多語言支持
支持13種印度語言,覆蓋主要印度語系。
高性能
在Fleurs數據集上創下新紀錄,並在BhasaAnuvaad測試集上顯著優於其他系統。
嚴格數據篩選
訓練前對數據集進行了對齊分數(0.8)和挖掘分數(0.6)的閾值過濾。

模型能力

語音轉文字翻譯
多語言語音識別
批量音頻處理

使用案例

語音轉錄
單音頻轉錄
將單個音頻文件轉錄為指定印度語言的文字
準確率高於基礎模型和競爭系統
批量處理
數據集批量轉錄
對Fleurs等語音數據集進行批量轉錄處理
支持批量處理,效率高
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase