W

Wav2vec2 Base 10k Voxpopuli Ft Sk

由facebook開發
基於VoxPopuli語料庫10K未標註數據預訓練,並在斯洛伐克語轉錄數據上微調的語音識別模型
下載量 39
發布時間 : 3/2/2022

模型概述

該模型是Facebook Wav2Vec2基礎模型的變體,專門針對斯洛伐克語語音識別任務進行了優化,適用於將斯洛伐克語語音轉換為文本的應用場景。

模型特點

多階段訓練
先在10K小時的VoxPopuli多語言語料庫上預訓練,再針對斯洛伐克語進行微調
高效語音表徵
基於Wav2Vec2架構,直接從原始音頻學習有效語音表徵
斯洛伐克語優化
專門針對斯洛伐克語語音特點進行優化,提高識別準確率

模型能力

斯洛伐克語語音識別
音頻轉文本
語音轉錄

使用案例

語音轉錄
會議記錄自動化
將斯洛伐克語會議錄音自動轉換為文字記錄
語音助手開發
為斯洛伐克語語音助手提供語音識別能力
無障礙應用
即時字幕生成
為斯洛伐克語視頻內容生成即時字幕
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase