W

Wav2vec2 Large Xlsr 53 Esperanto

cpierseによって開発
これはFacebookのwav2vec2-large-xlsr-53モデルをファインチューニングしたエスペラント(Esperanto)音声認識モデルで、Common Voiceデータセットでトレーニングされています。
ダウンロード数 8,681
リリース時間 : 3/2/2022

モデル概要

このモデルはエスペラントの自動音声認識(ASR)タスク専用で、エスペラント音声をテキストに変換できます。

モデル特徴

高精度エスペラント認識
Common Voiceエスペラントテストセットで12.31%のWER(単語誤り率)を達成
XLSR-53アーキテクチャベース
多言語事前トレーニングされた大規模モデルをファインチューニングしており、強力な音声特徴抽出能力を有する
言語モデル不要
追加の言語モデルサポートなしで直接使用可能

モデル能力

エスペラント音声認識
音声からテキストへの変換
16kHzオーディオ処理

使用事例

音声書き起こし
エスペラント音声書き起こし
エスペラント音声コンテンツをテキスト形式に変換
12.31% WER
学習支援ツール
エスペラント学習支援
エスペラント学習者の発音精度検証を支援
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase