W

Wav2vec2 Base 10k Voxpopuli Ft En

由facebook開發
基於VoxPopuli語料庫10K未標記子集預訓練並在英語轉錄數據上微調的Wav2Vec2基礎模型,適用於英語語音識別任務。
下載量 40
發布時間 : 3/2/2022

模型概述

該模型是Facebook的Wav2Vec2基礎模型,經過VoxPopuli語料庫預訓練和英語轉錄數據微調,主要用於英語自動語音識別(ASR)任務。

模型特點

VoxPopuli預訓練
基於VoxPopuli大規模多語言語音語料庫的10K未標記子集進行預訓練
英語轉錄微調
在英語轉錄數據上進行微調,優化英語語音識別性能
端到端語音識別
直接從原始音頻輸入生成文本輸出,無需中間特徵提取步驟

模型能力

英語語音識別
音頻轉錄
自動語音轉文本

使用案例

語音轉錄
會議記錄
將英語會議錄音自動轉錄為文字記錄
播客轉錄
將英語播客內容轉換為可搜索的文本格式
輔助技術
語音轉文字工具
為聽力障礙人士提供即時語音轉文字服務
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase