W

Wav2vec2 Large Xlsr Mongolian

manandeyによって開発
facebook/wav2vec2-large-xlsr-53をモンゴル語汎用音声データセットでファインチューニングした自動音声認識モデル
ダウンロード数 4,719
リリース時間 : 3/2/2022

モデル概要

このモデルはモンゴル語に最適化された自動音声認識(ASR)モデルで、Wav2Vec2アーキテクチャに基づき、モンゴル語音声をテキストに変換するために使用されます。

モデル特徴

モンゴル語最適化
モンゴル語音声認識に特化してファインチューニングされており、モンゴル語音声の理解能力が向上しています
XLSR事前学習ベース
facebook/wav2vec2-large-xlsr-53モデルをベースにファインチューニングされており、言語横断的音声表現学習を活用しています
16kHzサンプリングレート対応
16kHzサンプリングレートの音声入力をサポートしており、ほとんどの音声アプリケーションシナリオに適しています

モデル能力

モンゴル語音声認識
音声テキスト変換

使用事例

音声書き起こし
モンゴル語音声転写
モンゴル語音声コンテンツを編集可能なテキスト形式に変換
汎用音声モンゴル語テストセットで43.08%のWERを達成
音声アシスタント
モンゴル語音声コマンド認識
モンゴル語対応の音声アシスタントや音声制御アプリケーションの開発に使用可能
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase