C

Canary 1b Flash

nvidiaによって開発
NVIDIA NeMo Canary Flashは多言語マルチタスクモデルファミリーで、複数の音声ベンチマークで最先端の性能を実現しています。4つの言語の自動音声認識と翻訳タスクをサポートします。
ダウンロード数 125.22k
リリース時間 : 3/7/2025

モデル概要

Canary 1B FlashはCanaryアーキテクチャに基づく多言語マルチタスクモデルで、英語、ドイツ語、フランス語、スペイン語の自動音声テキスト変換(ASR)およびこれらの言語間の相互翻訳をサポートします。モデルは実験的なタイムスタンプ機能も提供します。

モデル特徴

多言語サポート
英語、ドイツ語、フランス語、スペイン語の4言語の音声認識と翻訳をサポート
マルチタスク能力
自動音声認識と音声翻訳タスクを同時にサポート
タイムスタンプ機能
実験的な単語レベルおよびセグメントレベルのタイムスタンプ機能を提供
効率的な推論
open-asr-leaderboardデータセットで1000 RTFx以上の推論速度を実現

モデル能力

英語音声認識
ドイツ語音声認識
フランス語音声認識
スペイン語音声認識
英独翻訳
英仏翻訳
英西翻訳
独英翻訳
仏英翻訳
西英翻訳
タイムスタンプ生成

使用事例

音声文字起こし
会議議事録
会議録音を自動的に文字に変換
4つの言語の正確な文字起こしをサポート
字幕生成
動画コンテンツの字幕を生成
タイムスタンプ付き字幕を生成可能
音声翻訳
リアルタイム翻訳
ある言語の音声を別の言語のテキストにリアルタイムで翻訳
4つの言語間の相互翻訳をサポート
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase