W

Wav2vec2 Large Xls R 300m Amharic Demo Colab

DipsankarSinhaによって開発
facebook/wav2vec2-xls-r-300mをcommon_voice_16_1データセットでファインチューニングしたアムハラ語音声認識モデル
ダウンロード数 18
リリース時間 : 6/23/2024

モデル概要

このモデルはアムハラ語に最適化された自動音声認識(ASR)モデルで、wav2vec2-xls-rアーキテクチャに基づき、Common Voiceデータセットでファインチューニングされています。

モデル特徴

wav2vec2-xls-rアーキテクチャ採用
強力なwav2vec2-xls-r-300mをベースモデルとして使用し、優れた音声特徴抽出能力を備えています
アムハラ語最適化
アムハラ語に特化してファインチューニングされており、特定言語の音声特徴に適応しています
Common Voiceデータセットで訓練
Common Voice 16.1データセットを使用して訓練されており、データの多様性と代表性が確保されています

モデル能力

アムハラ語音声認識
音声からテキストへの変換

使用事例

音声文字起こし
アムハラ語音声転写
アムハラ語音声をテキストに変換
単語誤り率0.8639
音声アシスタント
アムハラ語音声インタラクション
アムハラ語をサポートする音声アシスタントアプリケーションの構築に使用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase