W

Wav2vec2 Large Xlsr Mongolian

sammy786によって開発
facebook/wav2vec2-large-xlsr-53を基に汎用音声データセットでモンゴル語向けにファインチューニングした自動音声認識モデル
ダウンロード数 22
リリース時間 : 3/2/2022

モデル概要

これはモンゴル語音声認識専用のモデルで、XLSR-53アーキテクチャをファインチューニングしており、16kHzサンプリングレートの音声入力に対応しています。

モデル特徴

モンゴル語最適化
モンゴル語の音声特性に特化してファインチューニング
言語モデル不要
追加の言語モデルなしで直接使用可能
16kHzサンプリングレート対応
16kHzサンプリングレートの音声入力専用設計

モデル能力

モンゴル語音声認識
音声テキスト変換

使用事例

音声文字起こし
モンゴル語音声転写
モンゴル語音声内容をテキストに変換
単語誤り率38.14%
音声アシスタント
モンゴル語音声コマンド認識
モンゴル語音声アシスタントの基本認識機能
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase