R

Romanian Wav2vec2

由gigant開發
基於facebook/wav2vec2-xls-r-300m微調的羅馬尼亞語語音識別模型,在共同語音8.0和羅馬尼亞語音合成數據集上訓練,在HuggingFace魯棒語音挑戰賽中位列羅馬尼亞語音識別第一名。
下載量 88.90k
發布時間 : 3/2/2022

模型概述

本模型用於從16kHz採樣的音頻片段中進行羅馬尼亞語語音識別,預測文本為小寫且不包含標點符號。

模型特點

高性能羅馬尼亞語識別
在共同語音8.0測試集上達到WER 11.73(CER 2.93)的優異表現
語言模型增強
集成了5-gram語言模型,可顯著提升識別準確率(WER從46.99降至38.63)
多數據集訓練
結合了共同語音8.0和羅馬尼亞語音合成數據集進行訓練
競賽優勝模型
在HuggingFace魯棒語音挑戰賽中位列羅馬尼亞語音識別第一名

模型能力

羅馬尼亞語語音識別
16kHz音頻處理
無標點文本輸出

使用案例

語音轉文字
羅馬尼亞語語音轉錄
將羅馬尼亞語語音轉換為文本
在共同語音8.0測試集上WER 11.73
語音助手
羅馬尼亞語語音指令識別
用於羅馬尼亞語語音助手的前端語音識別
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase