S

Swahili Xlsr

Akashpb13によって開発
facebook/wav2vec2-xls-r-300mをファインチューニングしたスワヒリ語自動音声認識モデル、Common Voice 8データセットでトレーニング
ダウンロード数 26
リリース時間 : 3/2/2022

モデル概要

このモデルはスワヒリ語に最適化された自動音声認識(ASR)モデルで、XLS-Rアーキテクチャを基にファインチューニングされており、音声からテキストへの変換タスクに適しています

モデル特徴

多言語サポート
XLS-Rアーキテクチャに基づき、複数言語処理能力を備えています
高性能指標
Common Voice 8テストセットで11.76% WERと2.88% CERを達成
ロバスト性トレーニング
トレーニングデータは厳選され、反対票より支持票が多いサンプルのみを使用しています

モデル能力

音声からテキストへ変換
スワヒリ語認識
多言語音声処理

使用事例

音声文字起こし
スワヒリ語音声文字起こし
スワヒリ語の音声コンテンツをテキストに変換
テストWER 0.1176、CER 0.0288
音声アシスタント
スワヒリ語音声コマンド認識
東アフリカ地域の音声アシスタントアプリケーション向けコマンド認識
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase