W

Wav2vec2 Large Xlsr 53 Esperanto

由cpierse開發
這是一個基於Facebook的wav2vec2-large-xlsr-53模型微調的世界語(Esperanto)語音識別模型,使用Common Voice數據集訓練。
下載量 8,681
發布時間 : 3/2/2022

模型概述

該模型專門用於世界語的自動語音識別(ASR)任務,能夠將世界語語音轉換為文本。

模型特點

高精度世界語識別
在Common Voice世界語測試集上達到12.31%的WER(詞錯誤率)
基於XLSR-53架構
利用跨語言預訓練的大規模模型進行微調,具有強大的語音特徵提取能力
無需語言模型
可以直接使用,不需要額外的語言模型支持

模型能力

世界語語音識別
語音轉文本
16kHz音頻處理

使用案例

語音轉錄
世界語語音轉寫
將世界語語音內容轉換為文本形式
12.31% WER
輔助工具
世界語學習輔助
幫助世界語學習者驗證發音準確性
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase