W

Wav2vec2 Large Xls R 300m Latvian

由infinitejoy開發
這是一個基於facebook/wav2vec2-xls-r-300m在拉脫維亞語數據集上微調的自動語音識別模型,在Common Voice 7測試集上取得了16.98%的WER。
下載量 222
發布時間 : 3/2/2022

模型概述

該模型是用於拉脫維亞語自動語音識別(ASR)的預訓練模型,基於XLS-R架構微調,適用於語音轉文本任務。

模型特點

多語言預訓練
基於XLS-R-300M多語言模型微調,繼承了強大的跨語言語音表示能力
高效語音識別
在Common Voice 7拉脫維亞語測試集上達到16.98%的WER,表現優異
魯棒性訓練
在魯棒語音事件數據集上進行了測試,驗證了模型在不同場景下的適應性

模型能力

拉脫維亞語語音識別
語音轉文本
對話語音處理

使用案例

語音轉錄
語音備忘錄轉文字
將拉脫維亞語語音備忘錄轉換為可編輯文本
在清晰語音條件下準確率可達83%以上
語音助手
拉脫維亞語語音指令識別
用於本地化語音助手的基礎語音識別組件
在標準測試集上表現良好
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase