wav2vec2-base-en-voxpopuli-v2開源語音識別模型 - 適用於英語語音識別任務

首頁

Wav2vec2 Base En Voxpopuli V2

由facebook開發

基於VoxPopuli語料庫的24.1k無標註英語數據預訓練的Wav2Vec2基礎模型，適用於語音識別任務。

語音識別

Transformers

英語#英語語音預訓練 #無監督學習 #16kHz音頻處理

下載量 35

發布時間 : 3/2/2022

模型概述

該模型是Facebook的Wav2Vec2基礎版本，專門針對英語語音數據進行預訓練，主要用於自動語音識別（ASR）任務。

模型特點

基於VoxPopuli語料庫

使用VoxPopuli語料庫中的24.1k無標註英語數據進行預訓練，專注於英語語音識別。

16kHz採樣率

模型在16kHz採樣的語音音頻上進行預訓練，使用時需確保輸入音頻為相同採樣率。

無分詞器

該模型僅基於音頻進行預訓練，未配備分詞器，需額外創建並在標註文本數據上進行微調。

模型能力

語音識別

英語語音處理

使用案例

語音識別

英語語音轉文本

將英語語音轉換為文本，適用於語音助手、轉錄服務等場景。

屬性	詳情
模型類型	基於 Wav2Vec2 的語音處理模型
訓練數據	VoxPopuli 語料庫的 24.1k 條英文無標籤數據

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Wav2vec2 Base En Voxpopuli V2

模型概述

模型特點

模型能力

使用案例

🚀 Wav2Vec2-base-VoxPopuli-V2

🚀 快速開始

📚 詳細文檔

📄 許可證

📦 模型信息