W

Wav2vec2 Xls R 300m Wolof Lm

abdouaziizによって開発
これはfacebook/wav2vec2-xls-r-300mをファインチューニングしたウォロフ語自動音声認識モデルで、ウォロフ語のリソース不足問題を解決することを目的としています。
ダウンロード数 41
リリース時間 : 3/2/2022

モデル概要

このモデルはウォロフ語の自動音声認識(ASR)モデルで、wav2vec2アーキテクチャを基にALFFA_PUBLICデータセットでトレーニングされました。

モデル特徴

ウォロフ語サポート
リソースが不足しているウォロフ語に特化して最適化された音声認識モデル
wav2vec2アーキテクチャ採用
facebookのwav2vec2-xls-r-300mをベースモデルとしてファインチューニング
比較的高い精度
テストセットで21.25%の単語誤り率(WER)を達成

モデル能力

ウォロフ語音声認識
音声からテキストへの変換
音声転写

使用事例

音声転写
ウォロフ語音声転写
ウォロフ語の音声コンテンツをテキストに変換
21.25%の単語誤り率
言語リソース開発
ウォロフ語デジタルリソース構築
リソースが不足しているウォロフ語向けに音声認識能力を提供
16.8時間のトレーニングデータを使用したモデル
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase