A

Asr Wav2vec2 Dvoice Amharic

speechbrainによって開発
これはアムハラ語向けの自動音声認識モデルで、wav2vec 2.0アーキテクチャとCTC/Attentionメカニズムを使用してトレーニングされています
ダウンロード数 96
リリース時間 : 6/9/2022

モデル概要

このモデルは、アムハラ語の音声転写タスク専用のエンドツーエンド自動音声認識システムです。事前トレーニング済みのwav2vec 2.0モデルとCTCデコーダを組み合わせ、DVoiceアムハラ語データセットでファインチューニングされています。

モデル特徴

事前トレーニングモデルのファインチューニング
facebook/wav2vec2-large-xlsr-53事前トレーニングモデルを基にファインチューニングされ、アムハラ語の認識能力が向上しています
エンドツーエンドシステム
トークナイザーと音響モデルを含む完全なエンドツーエンドソリューションを提供します
マルチプラットフォームサポート
CPUとGPU推論をサポートし、さまざまなハードウェア環境に柔軟に展開できます

モデル能力

アムハラ語音声認識
音声転写
音声からテキストへの変換

使用事例

音声転写
アムハラ語音声転写
アムハラ語音声をテキストに変換
検証セットCER 6.71%、WER 25.50%
音声アシスタント
アムハラ語音声アシスタント
アムハラ語をサポートする音声インタラクションシステムの構築
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase