O

Owls 4B 180K

由espnet開發
OWLS是一套Whisper風格的模型,旨在幫助研究人員理解語音模型的擴展特性,支持多語言語音識別和翻譯。
下載量 40
發布時間 : 2/14/2025

模型概述

OWLS模型使用ESPnet開發,支持多語言語音識別、語音翻譯、話語級對齊、長文本轉錄和語言識別。

模型特點

多語言支持
支持多種語言的語音識別和翻譯任務。
大規模訓練
在高達360K小時的公開語音數據上進行訓練。
多樣化任務支持
支持語音識別、語音翻譯、話語級對齊、長文本轉錄和語言識別等多種任務。
開源工具包
使用ESPnet開發,完全開源,便於研究人員使用和擴展。

模型能力

語音識別
語音翻譯
話語級對齊
長文本轉錄
語言識別

使用案例

語音處理
多語言語音識別
將多種語言的語音轉換為文本。
跨語言語音翻譯
將一種語言的語音翻譯為另一種語言的文本。
語音分析
話語級對齊
分析語音中的話語邊界和時間對齊。
語言識別
識別語音中的語言類型。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase