exp_w2v2t_en_no-pretraining_s289開源英語語音識別模型

首頁

Exp W2v2t En No Pretraining S289

由jonatasgrosman開發

這是一個針對英語語音識別任務的模型，基於隨機初始化的wav2vec2架構，使用Common Voice 7.0數據集進行微調。

語音識別

Transformers

英語開源協議:Apache-2.0 #英語語音識別 #無預訓練模型 #16kHz採樣率

下載量 18

發布時間 : 7/8/2022

模型概述

該模型主要用於英語語音識別任務，能夠將英語語音轉換為文本。

模型特點

隨機初始化訓練

模型從隨機初始化的wav2vec2架構開始訓練，而非使用預訓練權重。

16kHz採樣率支持

模型要求輸入語音的採樣率為16kHz，確保語音識別的準確性。

模型能力

英語語音識別

語音轉文本

使用案例

語音轉錄

語音轉寫

將英語語音內容轉換為文本格式，適用於會議記錄、語音筆記等場景。

屬性	詳情
模型類型	用於英語語音識別的微調隨機初始化wav2vec2模型
訓練數據	Common Voice 7.0的訓練集
標籤	自動語音識別、英語
微調工具	HuggingSound

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Exp W2v2t En No Pretraining S289

模型概述

模型特點

模型能力

使用案例

🚀 exp_w2v2t_en_no-pretraining_s289

🚀 快速開始

📄 許可證

📋 信息表格