W

Wav2vec2 Large Xlsr Eo

gchhablaniによって開発
facebook/wav2vec2-large-xlsr-53モデルをベースに、Common Voiceデータセットを使ってエスペラント語に対して微調整された音声認識モデルです。
ダウンロード数 23
リリース時間 : 3/2/2022

モデル概要

このモデルはエスペラント語に最適化された自動音声認識(ASR)モデルで、エスペラント語の音声をテキストに変換することができます。

モデル特徴

高精度なエスペラント語認識
Common Voiceのエスペラント語テストセットで10.13%の単語誤り率(WER)を達成しました。
大規模な事前学習モデルをベースとしている
facebook/wav2vec2-large-xlsr-53モデルを微調整しており、強力な音声特徴抽出能力を引き継いでいます。
言語モデルが不要
追加の言語モデルのサポートなしで直接使用できます。

モデル能力

エスペラント語音声認識
音声からテキストへの変換

使用事例

音声書き起こし
エスペラント語の音声書き起こし
エスペラント語の音声内容をテキストに変換します。
単語誤り率10.13%
音声アシスタント
エスペラント語の音声命令認識
エスペラント語をサポートする音声アシスタントシステムに使用されます。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase