W

Wav2vec2 Large Xlsr Or

danurahulによって開発
Facebookのwav2vec2-large-xlsr-53モデルをオリヤ語で微調整した自動音声認識モデル
ダウンロード数 22
リリース時間 : 3/2/2022

モデル概要

このモデルはオリヤ語用に最適化された自動音声認識(ASR)システムで、Common Voiceデータセットを基に微調整され、16kHzのサンプリングレートの音声入力に適しています。

モデル特徴

多言語事前学習ベース
Facebookの多言語wav2vec2-large-xlsr-53モデルを微調整しており、強力な音声特徴抽出能力を持っています。
低リソース言語最適化
オリヤ語のような比較的リソースが少ない言語に特化して最適化されています。
エンドツーエンド音声認識
言語モデルを必要とせずに直接音声からテキストへの変換が可能です。

モデル能力

音声認識
音声をテキストに変換
オリヤ語音声処理

使用事例

音声文字起こし
オリヤ語音声文字起こし
オリヤ語の音声内容をテキストに変換します。
Common Voiceテストセットで54.6%のWERを達成しました。
音声アシスタント
オリヤ語音声アシスタント
オリヤ語をサポートする音声対話システムです。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase