W

Wav2vec2 Large Xls R 300m Ha Cv8

anuragshasによって開発
facebook/wav2vec2-xls-r-300mをCommon Voiceデータセットでファインチューニングしたハウサ語音声認識モデル
ダウンロード数 17
リリース時間 : 3/2/2022

モデル概要

これはハウサ語に最適化された自動音声認識(ASR)モデルで、XLS-R-300Mアーキテクチャを基に、Common Voice 8.0ハウサ語データセットでファインチューニングされています。

モデル特徴

ハウサ語最適化
ハウサ語音声認識タスクに特化してファインチューニング
XLS-Rアーキテクチャ採用
FacebookのXLS-R-300M事前学習モデルをベースに使用
低い単語誤り率
テストセットで36.295%のWER(言語モデル使用時)を達成

モデル能力

ハウサ語音声認識
音声からテキストへの変換
音声文字起こし

使用事例

音声文字起こし
ハウサ語音声テキスト化
ハウサ語音声コンテンツをテキストに変換
テストセットWER 36.295%
音声アシスタント
ハウサ語音声インタラクション
ハウサ語音声コマンド認識をサポート
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase