R

Reazonspeech Nemo V2

Developed by reazon-research
ReazonSpeech v2.0コーパスで訓練された日本語自動音声認識モデル、長音声推論をサポート
Downloads 3,897
Release Time : 1/30/2024

Model Overview

このモデルは日本語に最適化された自動音声認識システムで、数時間に及ぶ連続音声入力を処理可能

Model Features

長音声処理能力
数時間に及ぶ日本語長音声フラグメントの連続認識をサポート
効率的な注意機構
Longformer注意機構を採用、ローカルコンテキストサイズ256、グローバルトークンを含む
最適化訓練
AdamWオプティマイザーとNoamアニーリングスケジュールで100万ステップ訓練

Model Capabilities

日本語音声認識
長音声処理
連続音声転写

Use Cases

音声転写
会議議録自動生成
長時間のビジネス会議録音を自動的に文字記録に変換
メディアコンテンツ字幕生成
日本語ポッドキャスト、動画などのコンテンツに自動字幕を生成
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase