C

Canary 1b Flash

Developed by nvidia
NVIDIA NeMo Canary Flashは多言語マルチタスクモデルファミリーで、複数の音声ベンチマークで最先端の性能を実現しています。4つの言語の自動音声認識と翻訳タスクをサポートします。
Downloads 125.22k
Release Time : 3/7/2025

Model Overview

Canary 1B FlashはCanaryアーキテクチャに基づく多言語マルチタスクモデルで、英語、ドイツ語、フランス語、スペイン語の自動音声テキスト変換(ASR)およびこれらの言語間の相互翻訳をサポートします。モデルは実験的なタイムスタンプ機能も提供します。

Model Features

多言語サポート
英語、ドイツ語、フランス語、スペイン語の4言語の音声認識と翻訳をサポート
マルチタスク能力
自動音声認識と音声翻訳タスクを同時にサポート
タイムスタンプ機能
実験的な単語レベルおよびセグメントレベルのタイムスタンプ機能を提供
効率的な推論
open-asr-leaderboardデータセットで1000 RTFx以上の推論速度を実現

Model Capabilities

英語音声認識
ドイツ語音声認識
フランス語音声認識
スペイン語音声認識
英独翻訳
英仏翻訳
英西翻訳
独英翻訳
仏英翻訳
西英翻訳
タイムスタンプ生成

Use Cases

音声文字起こし
会議議事録
会議録音を自動的に文字に変換
4つの言語の正確な文字起こしをサポート
字幕生成
動画コンテンツの字幕を生成
タイムスタンプ付き字幕を生成可能
音声翻訳
リアルタイム翻訳
ある言語の音声を別の言語のテキストにリアルタイムで翻訳
4つの言語間の相互翻訳をサポート
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase