C

Canary 180m Flash

nvidiaによって開発
NVIDIA NeMo Canary Flash は、英語、ドイツ語、フランス語、スペイン語の自動音声認識と翻訳タスクをサポートする多言語多機能音声モデルです。
ダウンロード数 15.17k
リリース時間 : 3/11/2025

モデル概要

Canary 180M Flash はCanaryアーキテクチャに基づく多言語多機能モデルで、複数の音声ベンチマークテストにおいて最先端の性能を実現しています。4言語の自動音声テキスト認識(ASR)と、複数言語間の翻訳機能をサポートしています。

モデル特徴

多言語サポート
英語、ドイツ語、フランス語、スペイン語の4言語の音声認識と翻訳をサポート
マルチタスク処理
自動音声認識と自動音声翻訳タスクを同時に処理可能
タイムスタンプ機能
単語レベルおよびセグメントレベルのタイムスタンプ実験機能を提供
効率的な推論
1200 RTFx以上の推論速度で、リアルタイムアプリケーションに適している

モデル能力

音声認識
音声翻訳
タイムスタンプ生成
多言語処理

使用事例

音声文字起こし
会議議事録
会議の録音を自動的に文字に変換
複数言語の正確な文字起こしをサポート
字幕生成
動画コンテンツに自動的に字幕を生成
タイムスタンプ付きの字幕を生成可能
音声翻訳
リアルタイム翻訳
ある言語の音声を別の言語のテキストにリアルタイムで翻訳
複数言語間の相互翻訳をサポート
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase