NVIDIA Parakeet TDT 0.6B V2オープンソースモデル - 英語の音声をテキストに変換するための実用的なツール

ホーム

Parakeet Tdt 0.6b V2 Onnx

istupakovによって開発

NVIDIA Parakeet TDT 0.6B V2 は自動音声認識（ASR）タスクに基づくモデルで、英語音声からテキストへの変換タスクに適しています。

音声認識英語#英語音声認識 #ONNX最適化 #大規模モデル推論

ダウンロード数 129

リリース時間 : 5/6/2025

モデル概要

このモデルは自動音声認識（ASR）モデルで、主に英語音声をテキストに変換するために使用されます。NVIDIAのParakeetアーキテクチャに基づいており、リアルタイムまたはオフラインの音声認識タスクに適しています。

モデル特徴

高性能音声認識

このモデルは英語音声認識タスクで優れた性能を発揮し、効率的かつ正確に音声をテキストに変換できます。

ONNXフォーマット対応

モデルはONNXフォーマットに変換されており、さまざまなプラットフォームでの展開と使用が容易です。

簡単な統合

シンプルなPython APIを提供しており、既存のアプリケーションに迅速に統合できます。

モデル能力

英語音声認識

リアルタイム音声テキスト変換

オフライン音声処理

使用事例

音声テキスト変換

会議議事録

会議の録音をテキストに変換し、後続の整理や検索を容易にします。

高精度なテキスト出力により、手動での書き起こし時間を節約できます。

音声アシスタント

音声アシスタントに統合し、音声コマンドの認識と実行を実現します。

音声アシスタントの応答速度と精度を向上させます。

教育

音声ノート

講義や授業の録音をテキストノートに変換します。

学生が授業内容を復習・整理するのに便利です。

属性	详情
モデルタイプ	Automatic Speech Recognition
ベースモデル	nvidia/parakeet-tdt-0.6b-v2
パイプラインタグ	Automatic Speech Recognition

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Parakeet Tdt 0.6b V2 Onnx

モデル概要

モデル特徴

モデル能力

使用事例

🚀 NVIDIA Parakeet TDT 0.6B V2 (En)

🚀 クイックスタート

📦 インストール

💻 使用例

基本的な使用法

高度な使用法

📄 ライセンス