W

Wav2vec2 Xlsr Romansh Sursilvan

由sammy786開發
該模型是基於facebook/wav2vec2-xls-r-1b在羅曼什語-蘇塞爾瓦方言數據集上微調的自動語音識別模型,在Common Voice 8測試集上取得13.82%的詞錯誤率(WER)。
下載量 18
發布時間 : 3/2/2022

模型概述

這是一個針對羅曼什語-蘇塞爾瓦方言優化的自動語音識別模型,基於Facebook的wav2vec2-xls-r-1b架構微調而成。

模型特點

低詞錯誤率
在羅曼什語-蘇塞爾瓦方言測試集上取得13.82%的詞錯誤率(WER)和3.02%的字錯誤率(CER)
基於大模型微調
基於facebook/wav2vec2-xls-r-1b大模型微調,繼承了其強大的語音特徵提取能力
多數據集訓練
合併了Common Voice芬蘭語train.tsv、dev.tsv和other.tsv等多個數據集進行訓練

模型能力

羅曼什語-蘇塞爾瓦方言語音識別
魯棒語音事件檢測
對話語音處理

使用案例

語音轉錄
羅曼什語-蘇塞爾瓦方言語音轉文字
將羅曼什語-蘇塞爾瓦方言的語音內容轉換為文字
詞錯誤率13.82%,字錯誤率3.02%
語音助手
羅曼什語-蘇塞爾瓦方言語音助手
支持羅曼什語-蘇塞爾瓦方言的語音交互系統
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase