N

Nick Asr LID

ntoldalagiによって開発
未知のデータセットでトレーニングされた自動音声認識モデルで、言語識別タスクをサポート
ダウンロード数 28
リリース時間 : 4/15/2022

モデル概要

このモデルは自動音声認識(ASR)モデルで、言語識別(LID)タスクに使用される可能性があります。モデルのトレーニング過程では不安定な損失値が示され、最終的に検証セットでの単語誤り率と文字誤り率はともに1.0でした。

モデル特徴

マルチラウンドトレーニング
モデルは10ラウンドのトレーニングを経て、トレーニング損失の変化傾向を示しました
混合精度トレーニング
ネイティブAMP技術を使用した混合精度トレーニングを実施

モデル能力

音声認識
言語識別

使用事例

音声処理
音声からテキストへ
音声内容をテキスト形式に変換
現在の単語誤り率は1.0
言語識別
音声中の言語タイプを識別
現在の文字誤り率は1.0
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase