C

Canary 1b

nvidiaによって開発
Canary-1BはNVIDIA NeMoが開発した多言語マルチタスクモデルで、英語、ドイツ語、フランス語、スペイン語の自動音声認識と音声翻訳タスクをサポートします。
ダウンロード数 7,734
リリース時間 : 2/7/2024

モデル概要

Canary-1BはFastConformerとTransformerアーキテクチャに基づくエンコーダー-デコーダーモデルで、高精度な自動音声認識(ASR)と音声からテキストへの翻訳(AST)タスクのために特別に設計されています。

モデル特徴

多言語サポート
英語、ドイツ語、フランス語、スペイン語の4言語の音声認識と翻訳をサポート
マルチタスク能力
自動音声認識と音声からテキストへの翻訳タスクを同時に実行可能
高性能
複数のベンチマークテストで最先端の性能レベルを達成
柔軟な設定
句読点と大文字小文字(PnC)を含む出力を選択可能

モデル能力

英語音声認識
ドイツ語音声認識
フランス語音声認識
スペイン語音声認識
英語からドイツ語翻訳
英語からフランス語翻訳
英語からスペイン語翻訳
ドイツ語から英語翻訳
フランス語から英語翻訳
スペイン語から英語翻訳

使用事例

音声文字起こし
会議議事録の文字起こし
英語の会議録音を文字記録に変換
LibriSpeechテストセットでWER2.89を達成
多言語字幕生成
動画コンテンツに複数言語の字幕を生成
リアルタイム翻訳
多言語会議翻訳
スピーカーの音声を他の言語のテキストにリアルタイム翻訳
英独翻訳BLEU値32.15、英仏翻訳BLEU値40.76
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase