W

Wav2vec2 Large Xlsr Or

gchhablaniによって開発
これはfacebook/wav2vec2-large-xlsr-53モデルをOdia言語でファインチューニングした自動音声認識(ASR)モデルで、Common Voiceデータセットを使用してトレーニングされています。
ダウンロード数 22
リリース時間 : 3/2/2022

モデル概要

このモデルはOdia言語の音声認識タスク専用に設計されており、Odia音声をテキストに変換できます。

モデル特徴

多言語事前学習ベース
facebook/wav2vec2-large-xlsr-53モデルをベースにファインチューニングされており、53言語で事前学習済みです。
Odia言語最適化
Odia言語に特化してファインチューニングされており、この言語の認識精度が向上しています。
16kHzサンプリングレート対応
16kHzサンプリングレートの音声入力をサポートしており、ほとんどの音声認識シナリオに適しています。

モデル能力

音声認識
Odia音声テキスト変換

使用事例

音声文字起こし
Odia音声転写
Odia音声コンテンツをテキスト形式に変換
Common Voiceテストセットで52.64%のWERを達成
音声アシスタント
Odia音声コマンド認識
Odia言語をサポートする音声アシスタントの開発に使用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase