C

Canary 180m Flash

由nvidia開發
NVIDIA NeMo Canary Flash 是一個多語言多任務語音模型,支持英語、德語、法語和西班牙語的自動語音識別和翻譯任務。
下載量 15.17k
發布時間 : 3/11/2025

模型概述

Canary 180M Flash 是基於Canary架構的多語言多任務模型,在多個語音基準測試中實現了最先進的性能。支持4種語言的自動語音到文本識別(ASR),以及多種語言間的翻譯功能。

模型特點

多語言支持
支持英語、德語、法語和西班牙語四種語言的語音識別和翻譯
多任務處理
能夠同時處理自動語音識別和自動語音翻譯任務
時間戳功能
提供單詞級和片段級時間戳實驗功能
高效推理
超過1200 RTFx的推理速度,適合即時應用

模型能力

語音識別
語音翻譯
時間戳生成
多語言處理

使用案例

語音轉錄
會議記錄
將會議錄音自動轉錄為文字
支持多種語言的準確轉錄
字幕生成
為視頻內容自動生成字幕
可生成帶時間戳的字幕
語音翻譯
即時翻譯
將一種語言的語音即時翻譯為另一種語言的文字
支持多種語言間的互譯
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase