C

Canary 1b

由nvidia開發
Canary-1B是NVIDIA NeMo開發的多語言多任務模型,支持英語、德語、法語和西班牙語的自動語音識別和語音翻譯任務。
下載量 7,734
發布時間 : 2/7/2024

模型概述

Canary-1B是一個基於FastConformer和Transformer架構的編碼器-解碼器模型,專門設計用於高精度的自動語音識別(ASR)和語音到文本翻譯(AST)任務。

模型特點

多語言支持
支持英語、德語、法語和西班牙語四種語言的語音識別和翻譯
多任務能力
可同時執行自動語音識別和語音到文本翻譯任務
高性能
在多個基準測試中達到最先進的性能水平
靈活配置
可選擇是否包含標點和大小寫(PnC)的輸出

模型能力

英語語音識別
德語語音識別
法語語音識別
西班牙語語音識別
英語到德語翻譯
英語到法語翻譯
英語到西班牙語翻譯
德語到英語翻譯
法語到英語翻譯
西班牙語到英語翻譯

使用案例

語音轉錄
會議記錄轉錄
將英語會議錄音轉換為文字記錄
在LibriSpeech測試集上WER達到2.89
多語言字幕生成
為視頻內容生成多種語言的字幕
即時翻譯
跨語言會議翻譯
即時將演講者的語音翻譯成其他語言文本
英德翻譯BLEU值32.15,英法翻譯BLEU值40.76
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase