E

Exp W2v2t En No Pretraining S289

由jonatasgrosman開發
這是一個針對英語語音識別任務的模型,基於隨機初始化的wav2vec2架構,使用Common Voice 7.0數據集進行微調。
下載量 18
發布時間 : 7/8/2022

模型概述

該模型主要用於英語語音識別任務,能夠將英語語音轉換為文本。

模型特點

隨機初始化訓練
模型從隨機初始化的wav2vec2架構開始訓練,而非使用預訓練權重。
16kHz採樣率支持
模型要求輸入語音的採樣率為16kHz,確保語音識別的準確性。

模型能力

英語語音識別
語音轉文本

使用案例

語音轉錄
語音轉寫
將英語語音內容轉換為文本格式,適用於會議記錄、語音筆記等場景。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase