wav2vec2-base-10k-voxpopuli開源語音識別模型

Home

Wav2vec2 Base 10k Voxpopuli

Developed by facebook

基於VoxPopuli語料庫1萬條未標註數據預訓練的語音識別基礎模型，支持多語言語音處理

語音識別

Transformers

Other#多語言語音識別 #無監督預訓練 #VoxPopuli語料庫

Downloads 2,504

Release Time : 3/2/2022

Model Overview

Facebook開發的Wav2Vec2語音識別基礎模型，通過自監督學習從原始音頻中提取語音特徵，適用於多語言自動語音識別任務

Model Features

多語言支持

基於VoxPopuli多語言語料庫訓練，支持多種語言的語音識別

自監督預訓練

使用1萬小時未標註語音數據進行自監督學習，有效捕捉語音特徵

可微調架構

提供基礎模型架構，可針對特定語言或領域進行微調

Model Capabilities

自動語音識別

語音特徵提取

多語言語音處理

Use Cases

語音轉文字

會議記錄自動化

將會議錄音自動轉換為文字記錄

字幕生成

為視頻內容自動生成字幕

語音分析

語音內容分析

從語音數據中提取關鍵信息進行分析

屬性	詳情
模型類型	基於Wav2Vec2的自動語音識別模型
訓練數據	VoxPopuli語料庫的10k無標籤子集
許可證	CC BY-NC 4.0

Featured Recommended AI Models

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers Supports Multiple Languages

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統 Chinese

uer

2,694

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

Wav2vec2 Base 10k Voxpopuli

Model Overview

Model Features

Model Capabilities

Use Cases

🚀 Wav2Vec2-Base-VoxPopuli

🚀 快速開始

模型信息

論文引用

📚 詳細文檔

微調說明

📄 許可證