wav2vec2-large-pitch-recognition開源語音識別模型

首頁

Wav2vec2 Large Pitch Recognition

由vumichien開發

基於facebook/wav2vec2-large-xlsr-53在日語口音數據集上微調的語音識別模型

語音識別

Transformers

日語開源協議:Apache-2.0 #日語口音識別 #低詞錯誤率 #語音轉寫

下載量 15

發布時間 : 3/2/2022

模型概述

該模型專注於日語口音的自動語音識別任務，能夠識別帶有口音的日語語音輸入

模型特點

日語口音識別

專門針對日語口音優化的語音識別能力

基於Wav2Vec2架構

採用先進的Wav2Vec2架構，具有強大的語音特徵提取能力

16kHz採樣率支持

支持16kHz採樣率的語音輸入

模型能力

日語語音識別

口音語音處理

自動語音轉文本

使用案例

語音轉寫

日語口音語音轉寫

將帶有地方口音的日語語音轉換為文本

詞錯誤率15.82%

語音助手

口音友好的語音助手

為不同地區的日語使用者提供更準確的語音交互

屬性	詳情
模型類型	基於微調的 Wav2Vec2 模型用於日語口音語音識別
訓練數據	日語口音數據集

模型名稱	任務類型	數據集	評估指標	指標值
Wav2vec2 Accent Japanese	自動語音識別	日語口音數據集	字錯率（WER）	15.82

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Wav2vec2 Large Pitch Recognition

模型概述

模型特點

模型能力

使用案例

🚀 Wav2Vec2 Accent Japanese

🚀 快速開始

✨ 主要特性

📦 安裝指南

💻 使用示例

📚 詳細文檔

模型信息

測試結果

模型索引

🔧 技術細節

📄 許可證