N

Nue Asr

rinnaによって開発
Nue ASRはエンドツーエンドの日本語音声認識モデルで、事前学習された音声と言語モデルを統合し、認識精度が高く高速です。
ダウンロード数 722
リリース時間 : 12/7/2023

モデル概要

このモデルはエンドツーエンドの日本語音声認識を提供し、最新のASRモデルと同等の認識精度を実現します。GPUを使用することで、リアルタイムよりも高速な音声認識が可能です。

モデル特徴

エンドツーエンド音声認識
事前学習された音声と言語モデルを統合し、完全なエンドツーエンドソリューションを提供します。
高性能
最新のASRモデルと同等の認識精度を実現し、推論速度はリアルタイムよりも高速です。
事前学習モデル統合
japanese-hubert-baseとjapanese-gpt-neox-3.6bの事前学習重みを使用して初期化されます。
大規模トレーニングデータ
約19,000時間の日本語音声コーパスReazonSpeech v1でトレーニングされました。

モデル能力

日本語音声認識
エンドツーエンド音声テキスト変換
リアルタイム音声処理

使用事例

音声文字起こし
会議議事録
日本語会議の録音をリアルタイムでテキストに変換
高精度な会議議事録テキスト
字幕生成
日本語動画コンテンツに自動的に字幕を生成
同期された字幕ファイル
音声アシスタント
日本語音声コマンド認識
日本語音声コマンドを認識・理解
正確なコマンド認識
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase