W

Wav2vec2 Large Xls R 300m Hsb V2

DrishtiSharmaによって開発
これはFacebookのwav2vec2-xls-r-300mモデルを上ソルブ語(HSB)データセットでファインチューニングした自動音声認識(ASR)モデルです。
ダウンロード数 19
リリース時間 : 3/2/2022

モデル概要

このモデルは上ソルブ語の音声認識タスクに特化しており、Common Voice 8データセットでファインチューニングされており、上ソルブ語の音声をテキストに変換できます。

モデル特徴

上ソルブ語専用
上ソルブ語に最適化された音声認識モデル
大規模事前学習モデルベース
Facebookのwav2vec2-xls-r-300mモデルをファインチューニングしており、強力な音声特徴抽出能力を備えています
比較的高い認識精度
Common Voice 8テストセットで46.5%の単語誤り率(WER)と11.4%の文字誤り率(CER)を達成

モデル能力

上ソルブ語音声認識
音声からテキストへの変換
自動音声転写

使用事例

音声転写
上ソルブ語音声転写
上ソルブ語の音声内容をテキストに変換
Common Voice 8テストセットでWERが46.5%
言語保護
少数民族言語のデジタル化
上ソルブ語などの少数民族言語の保存とデジタル化を支援
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase