W

Wav2vec2 Base 10k Voxpopuli Ft Sl

由facebook開發
基於Facebook Wav2Vec2基礎模型,在VoxPopuli語料庫的10K未標註子集上預訓練,並在斯洛文尼亞語轉錄數據上微調的自動語音識別模型。
下載量 26
發布時間 : 3/2/2022

模型概述

該模型是一個針對斯洛文尼亞語優化的自動語音識別系統,能夠將語音轉換為文本。

模型特點

多語言預訓練
基於VoxPopuli多語言語料庫進行預訓練,具有跨語言學習能力
斯洛文尼亞語優化
專門針對斯洛文尼亞語進行了微調,提高了該語言的識別準確率
端到端模型
直接從原始音頻學習語音表示,無需傳統語音識別流程中的手工特徵提取

模型能力

語音識別
音頻轉文本
斯洛文尼亞語處理

使用案例

語音轉錄
會議記錄自動化
將斯洛文尼亞語會議錄音自動轉換為文字記錄
語音助手開發
為斯洛文尼亞語語音助手提供語音識別能力
無障礙技術
即時字幕生成
為斯洛文尼亞語視頻內容生成即時字幕
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase