C

Canary 1b Flash

由nvidia開發
NVIDIA NeMo Canary Flash 是一個多語言多任務模型家族,在多個語音基準測試中實現了最先進的性能。支持四種語言的自動語音識別和翻譯任務。
下載量 125.22k
發布時間 : 3/7/2025

模型概述

Canary 1B Flash 是基於Canary架構的多語言多任務模型,支持英語、德語、法語、西班牙語的自動語音轉文本識別(ASR),以及這些語言之間的互譯。模型還提供實驗性的時間戳功能。

模型特點

多語言支持
支持英語、德語、法語、西班牙語四種語言的語音識別和翻譯
多任務能力
同時支持自動語音識別和語音翻譯任務
時間戳功能
提供實驗性的單詞級和片段級時間戳功能
高效推理
在open-asr-leaderboard數據集上實現超過1000 RTFx的推理速度

模型能力

英語語音識別
德語語音識別
法語語音識別
西班牙語語音識別
英德翻譯
英法翻譯
英西翻譯
德英翻譯
法英翻譯
西英翻譯
生成時間戳

使用案例

語音轉錄
會議記錄
將會議錄音自動轉錄為文字
支持四種語言的準確轉錄
字幕生成
為視頻內容生成字幕
可生成帶時間戳的字幕
語音翻譯
即時翻譯
將一種語言的語音即時翻譯為另一種語言的文本
支持四種語言間的互譯
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase