N

Nue Asr

由rinna開發
Nue ASR是一種端到端的日語語音識別模型,集成了預訓練的語音和語言模型,識別準確度高且速度快。
下載量 722
發布時間 : 12/7/2023

模型概述

該模型提供端到端的日語語音識別,識別準確度與最新的ASR模型相當。通過使用GPU,可以實現比即時更快的語音識別速度。

模型特點

端到端語音識別
集成了預訓練的語音和語言模型,提供完整的端到端解決方案。
高性能
識別準確度與最新的ASR模型相當,且推理速度快於即時。
預訓練模型集成
使用japanese-hubert-base和japanese-gpt-neox-3.6b的預訓練權重初始化。
大規模訓練數據
在約19,000小時的日語語音語料庫ReazonSpeech v1上進行訓練。

模型能力

日語語音識別
端到端語音轉文本
即時語音處理

使用案例

語音轉寫
會議記錄
將日語會議錄音即時轉寫為文本
高準確度的會議記錄文本
字幕生成
為日語視頻內容自動生成字幕
同步的字幕文件
語音助手
日語語音指令識別
識別和理解日語語音命令
準確的指令識別
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase