W

Wav2vec2 Base 10k Voxpopuli Ft De

由facebook開發
基於Facebook Wav2Vec2基礎模型,在VoxPopuli語料庫10K無標註子集上預訓練,並在德語轉錄數據上微調的語音識別模型
下載量 46
發布時間 : 3/2/2022

模型概述

該模型是一個德語自動語音識別(ASR)系統,能夠將德語語音轉換為文本。基於Wav2Vec2架構,通過大規模無監督預訓練和有監督微調實現高性能語音識別。

模型特點

大規模預訓練
基於VoxPopuli語料庫10K小時無標註數據進行預訓練,學習豐富的語音表徵
德語優化
專門針對德語語音數據進行微調,在德語語音識別任務上表現優異
端到端學習
直接從原始音頻學習語音特徵,無需人工設計特徵提取器

模型能力

德語語音識別
音頻轉文本
語音轉錄

使用案例

語音轉錄
會議記錄自動化
自動將德語會議錄音轉換為文字記錄
語音助手
為德語語音助手提供語音識別能力
無障礙技術
即時字幕生成
為德語視頻內容生成即時字幕
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase