W

Wav2vec2 Large Xlsr Rm Sursilv

gchhablaniによって開発
これはfacebook/wav2vec2-large-xlsr-53モデルを基にファインチューニングした自動音声認識モデルで、ロマンシュ語のスルシルヴァ方言を識別するために特別に設計されています。
ダウンロード数 27
リリース時間 : 3/2/2022

モデル概要

このモデルはCommon Voiceデータセットのロマンシュ語スルシルヴァ方言データを使用してファインチューニングされており、音声認識タスクに適しています。16kHzサンプリングレートの音声入力をサポートしています。

モデル特徴

高精度音声認識
Common Voiceテストセットで25.16%の単語誤り率(WER)を達成。
低リソース言語サポート
ロマンシュ語のスルシルヴァ方言に特化して最適化されており、低リソース言語シナリオに適しています。
言語モデル不要
追加の言語モデルサポートなしで直接使用可能。

モデル能力

音声認識
音声からテキストへの変換
ロマンシュ語処理

使用事例

音声文字起こし
方言音声文字起こし
ロマンシュ語スルシルヴァ方言の音声をテキストに変換
単語誤り率25.16%
音声アシスタント
方言音声アシスタント
ロマンシュ語ユーザーに音声インタラクション機能を提供
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase