afrispeech_large_A100オープンソース音声認識モデル - 高精度でアフリカの言語を認識、無料で利用可能！

Afrispeech Large A100

Seyfelislemによって開発

Whisper-large-v2をファインチューニングしたアフリカ言語音声認識モデル。afrispeech-200データセットで訓練され、単語誤り率(WER)は14.81

ダウンロード数 20

リリース時間 : 4/3/2023

モデル概要

このモデルはアフリカ言語向けの自動音声認識(ASR)システムで、openai/whisper-large-v2モデルをファインチューニングしており、アフリカ言語の認識精度向上に特化しています。

アフリカ言語最適化

アフリカ言語に特化してファインチューニングされており、アフリカ言語の認識精度が向上しています

低単語誤り率

afrispeech-200データセットで14.81%の単語誤り率(WER)を達成

Whisperアーキテクチャベース

強力なWhisper-large-v2モデルを基盤としており、その優れた音声認識能力を継承しています

音声認識

アフリカ言語処理

自動文字起こし

音声からテキストへ

アフリカ言語録音の文字起こし

アフリカ言語の音声内容を自動的にテキストに変換

単語誤り率14.81%

音声アシスタント

アフリカ言語音声アシスタント

アフリカ言語をサポートする音声対話システム