H

HIYACCENT Wav2Vec2

codeceejayによって開発
HIYACCENTはナイジェリア英語アクセントに最適化された音声認識システムで、Wav2Vec2アーキテクチャを改良し、認識性能を20%以上向上させました。
ダウンロード数 27
リリース時間 : 3/2/2022

モデル概要

このモデルは、FacebookのWav2vecアーキテクチャに新しいネットワーク層を追加してベースラインモデルとナイジェリア英語音声の差異を捉え、モデルの最上位層にCTC損失関数を追加して音声-テキストアラインメントの柔軟性を強化しました。母語の発音影響が強いナイジェリア英語話者向けに特別に開発されています。

モデル特徴

ナイジェリアアクセント最適化
ナイジェリア英語話者の発音特性に特化して最適化され、認識性能が20%以上向上しました。
改良型Wav2Vec2アーキテクチャ
標準Wav2vecアーキテクチャに新しいネットワーク層を追加し、ナイジェリア英語と標準英語の発音差異をより効果的に捉えます。
CTC損失関数
モデル最上位層にCTC損失関数を追加し、音声-テキストアラインメントの柔軟性を強化しました。

モデル能力

ナイジェリアアクセント英語音声認識
16kHzサンプリングレート音声処理

使用事例

音声テキスト化
ナイジェリア英語音声転写
ナイジェリア英語話者の音声を正確にテキストに転写
標準モデル比で20%以上の性能向上
音声アシスタント
ナイジェリアアクセント音声インタラクション
ナイジェリアユーザー向けに精度の高い音声アシスタント体験を提供
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase