P

Parakeet Tdt 0.6b V2 Onnx

由istupakov開發
NVIDIA Parakeet TDT 0.6B V2 是一個基於自動語音識別(ASR)任務的模型,適用於英語語音轉文本任務。
下載量 129
發布時間 : 5/6/2025

模型概述

該模型是一個自動語音識別(ASR)模型,主要用於將英語語音轉換為文本。它基於 NVIDIA 的 Parakeet 架構,適用於實時或離線語音識別任務。

模型特點

高性能語音識別
該模型在英語語音識別任務中表現出色,能夠高效準確地將語音轉換為文本。
支持 ONNX 格式
模型已轉換為 ONNX 格式,便於在不同平臺上部署和使用。
易於集成
提供簡單的 Python API,便於快速集成到現有應用中。

模型能力

英語語音識別
實時語音轉文本
離線語音處理

使用案例

語音轉文本
會議記錄
將會議錄音轉換為文本,便於後續整理和檢索。
高準確率的文本輸出,節省人工轉錄時間。
語音助手
集成到語音助手中,實現語音命令的識別和執行。
提升語音助手的響應速度和準確性。
教育
語音筆記
將講座或課程錄音轉換為文本筆記。
方便學生複習和整理課程內容。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase