W

Wynehills Mimi ASR

mimiによって開発
これは自動音声認識(ASR)モデルで、未知のデータセットでトレーニングされ、単語誤り率(WER)は0.6309です。
ダウンロード数 26
リリース時間 : 3/2/2022

モデル概要

このモデルは自動音声認識システムで、音声をテキストに変換できます。モデルのトレーニングにはAdamオプティマイザーと線形学習率スケジューラーが使用されました。

モデル特徴

最適化されたトレーニングプロセス
Adamオプティマイザーと線形学習率スケジューラーを使用してトレーニングされ、学習率は0.0001です
混合精度トレーニング
ネイティブAMP混合精度トレーニング技術を採用してトレーニング効率を向上させました

モデル能力

音声からテキストへの変換
自動音声認識

使用事例

音声文字起こし
会議議事録
会議の録音を自動的に文字記録に変換します
単語誤り率0.6309
音声メモの文字起こし
音声メモを編集可能なテキストに変換します
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase