X

Xls R 300m Npsc Seq2seq

Rolv-Arildによって開発
このモデルは自動音声認識(ASR)モデルで、特定のデータセットを指定せずに訓練され、最終的な単語誤り率(WER)は0.3144です。
ダウンロード数 18
リリース時間 : 3/2/2022

モデル概要

これは自動音声認識モデルで、音声をテキストに変換することができます。

モデル特徴

低単語誤り率
評価データセットで0.3144の単語誤り率(WER)を達成し、良好な性能を示しています。
最適化された訓練
Adamオプティマイザーと線形学習率スケジューラーを使用して訓練され、安定した訓練プロセスを実現しています。

モデル能力

音声からテキストへの変換
自動音声認識

使用事例

音声文字起こし
会議議事録
会議の録音を自動的に文字記録に変換
単語誤り率0.3144
字幕生成
動画コンテンツに自動的に字幕を生成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase