wav2vec2-large-uralic-voxpopuli-v2開源語音模型 - 支持烏拉爾語系語音處理

首頁

Wav2vec2 Large Uralic Voxpopuli V2

由facebook開發

基於VoxPopuli語料庫的42.5小時烏拉爾語系無標註數據預訓練的Wav2Vec2大型語音模型

語音識別

Transformers

#烏拉爾語系語音識別 #無監督預訓練 #16kHz音頻處理

下載量 46

發布時間 : 3/2/2022

模型概述

這是一個基於Facebook Wav2Vec2架構的大型語音模型，專門針對烏拉爾語系進行預訓練，適用於語音識別任務。

模型特點

烏拉爾語系專用

專門針對烏拉爾語系進行預訓練，適用於該語系的語音識別任務

基於VoxPopuli語料庫

使用VoxPopuli多語言語音語料庫中的42.5小時烏拉爾語系數據進行預訓練

16kHz音頻支持

模型預訓練使用16kHz採樣率的語音音頻，使用時需確保輸入音頻匹配此採樣率

模型能力

語音特徵提取

語音表示學習

使用案例

語音技術

烏拉爾語系語音識別

可用於開發烏拉爾語系的自動語音識別系統

需在標註數據上進行微調後才能獲得最佳效果

屬性	詳情
模型類型	僅在烏拉爾語系上預訓練的 Wav2Vec2 大型模型
訓練數據	VoxPopuli 語料庫中的 42.5 份無標籤數據

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Wav2vec2 Large Uralic Voxpopuli V2

模型概述

模型特點

模型能力

使用案例

🚀 Wav2Vec2-large-VoxPopuli-V2

🚀 快速開始

📚 詳細文檔

模型信息

引用信息

更多信息

📄 許可證