C

Canary 1b

Developed by nvidia
Canary-1BはNVIDIA NeMoが開発した多言語マルチタスクモデルで、英語、ドイツ語、フランス語、スペイン語の自動音声認識と音声翻訳タスクをサポートします。
Downloads 7,734
Release Time : 2/7/2024

Model Overview

Canary-1BはFastConformerとTransformerアーキテクチャに基づくエンコーダー-デコーダーモデルで、高精度な自動音声認識(ASR)と音声からテキストへの翻訳(AST)タスクのために特別に設計されています。

Model Features

多言語サポート
英語、ドイツ語、フランス語、スペイン語の4言語の音声認識と翻訳をサポート
マルチタスク能力
自動音声認識と音声からテキストへの翻訳タスクを同時に実行可能
高性能
複数のベンチマークテストで最先端の性能レベルを達成
柔軟な設定
句読点と大文字小文字(PnC)を含む出力を選択可能

Model Capabilities

英語音声認識
ドイツ語音声認識
フランス語音声認識
スペイン語音声認識
英語からドイツ語翻訳
英語からフランス語翻訳
英語からスペイン語翻訳
ドイツ語から英語翻訳
フランス語から英語翻訳
スペイン語から英語翻訳

Use Cases

音声文字起こし
会議議事録の文字起こし
英語の会議録音を文字記録に変換
LibriSpeechテストセットでWER2.89を達成
多言語字幕生成
動画コンテンツに複数言語の字幕を生成
リアルタイム翻訳
多言語会議翻訳
スピーカーの音声を他の言語のテキストにリアルタイム翻訳
英独翻訳BLEU値32.15、英仏翻訳BLEU値40.76
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase