S

Stt Rw Conformer Transducer Large

nvidiaによって開発
これはルワンダ語の音声認識に使用されるConformer-Transducerの大型モデルで、音声を小文字のラテン文字に文字起こしでき、空白とアポストロフィをサポートします。
ダウンロード数 116
リリース時間 : 7/31/2022

モデル概要

このモデルは、空白とアポストロフィを含む小文字のラテン文字に音声を文字起こしするために使用され、約2000時間のルワンダ語音声データで学習されています。

モデル特徴

高精度な文字起こし
音声を小文字のラテン文字に正確に文字起こしでき、空白とアポストロフィをサポートします。
大型モデルアーキテクチャ
Conformerに基づく非自己回帰の「大型」バリエーションで、パラメータが約1.2億あり、性能が強力です。
使いやすさ
NeMoツールキットで使用でき、推論と微調整が容易です。

モデル能力

音声認識
音声文字起こし
ルワンダ語のサポート

使用事例

音声文字起こし
音声ファイルの文字起こし
ルワンダ語の音声ファイルをテキストに文字起こしする
精度が比較的高く、テストセットのWERは16.19%です。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase