W

Wav2vec2 Base Sv Voxpopuli V2

由facebook開發
基於Facebook Wav2Vec2架構的語音模型,專門針對瑞典語進行預訓練,使用VoxPopuli語料庫的16.3k未標註數據。
下載量 30
發布時間 : 3/2/2022

模型概述

這是一個基礎語音識別模型,專注於瑞典語處理,適用於語音轉文本任務。

模型特點

瑞典語專用
專門針對瑞典語進行預訓練,優化了瑞典語語音識別性能。
基於VoxPopuli語料庫
使用VoxPopuli語料庫中的16.3k小時瑞典語數據進行訓練。
16kHz音頻支持
模型針對16kHz採樣的語音音頻進行優化,使用時需確保輸入音頻匹配此採樣率。

模型能力

瑞典語語音識別
語音特徵提取

使用案例

語音轉文字
瑞典語語音轉錄
將瑞典語語音內容轉換為文本
語音分析
瑞典語語音特徵分析
提取瑞典語語音的特徵表示
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase