W

Wav2vec2 Large Xlsr Mvc Swahili

eddiegulayによって開発
このモデルはfacebook/wav2vec2-large-xlsr-53をベースにファインチューニングしたバージョンで、スワヒリ語(Swahili)の自動音声認識タスク専用に設計されています。
ダウンロード数 9,413
リリース時間 : 11/6/2023

モデル概要

これはスワヒリ語に最適化された自動音声認識モデルで、wav2vec2アーキテクチャに基づき、Common Voice 13.0データセットでファインチューニングされています。

モデル特徴

スワヒリ語最適化
スワヒリ語専用にファインチューニングされており、優れた音声認識性能を提供します
wav2vec2-large-xlsr-53ベース
強力なwav2vec2-large-xlsr-53ベースモデルを使用しており、優れた音声特徴抽出能力を備えています
低単語誤り率
Common Voiceテストセットで0.2の単語誤り率を達成

モデル能力

スワヒリ語音声認識
音声文字起こし
音声からテキストへの変換

使用事例

音声文字起こし
スワヒリ語音声文字起こし
スワヒリ語の音声コンテンツをテキストに変換
単語誤り率0.2
音声アシスタント
スワヒリ語音声アシスタント
スワヒリ語をサポートする音声対話システムの構築
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase