W

Wav2vec2 Large Xlsr 53 Rm Vallader

anuragshasによって開発
facebook/wav2vec2-large-xlsr-53モデルを微調整したロマンシュ語ヴァラディエル方言の音声認識モデルで、単語誤り率は32.89%です。
ダウンロード数 58
リリース時間 : 3/2/2022

モデル概要

このモデルは、ロマンシュ語ヴァラディエル方言に最適化された自動音声認識(ASR)モデルで、一般音声データセットを基に微調整され、16kHzのサンプリングレートの音声入力認識をサポートしています。

モデル特徴

低リソース言語サポート
使用頻度の低いロマンシュ語ヴァラディエル方言に特化して最適化されています。
言語モデル不要
直接使用でき、追加の言語モデルのサポートは必要ありません。
16kHzサンプリングレートサポート
一般的な音声入力デバイスのサンプリングレート標準に対応しています。

モデル能力

音声認識
オーディオをテキストに変換
ロマンシュ語処理

使用事例

音声文字起こし
方言音声文字起こし
ロマンシュ語ヴァラディエル方言の音声内容をテキストに変換します。
単語誤り率32.89%
言語保護
少数民族言語のデジタル化
絶滅危惧のロマンシュ語方言の記録と保護に役立ちます。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase