W

Wav2vec2 Base 960h 4 Gram

由patrickvonplaten開發
基於Facebook的Wav2Vec2-Base-960h模型,增加了英語4-gram語言模型,用於提高自動語音識別(ASR)的準確率。
下載量 19
發布時間 : 4/12/2022

模型概述

該模型是Wav2Vec2的變體,專門用於英語自動語音識別任務,通過集成4-gram語言模型提升了識別準確率。

模型特點

集成4-gram語言模型
使用Librispeech官方ngrams中的4-gram.arpa.gz文件,提高了語音識別的準確率。
基於Wav2Vec2架構
採用Facebook的Wav2Vec2-Base-960h模型作為基礎,具有強大的語音特徵提取能力。

模型能力

英語語音識別
高準確率語音轉文本

使用案例

語音轉錄
音頻內容轉錄
將英語語音內容自動轉換為文本
在LibriSpeech測試集上達到2.59-6.46的WER
語音助手
語音命令識別
用於語音助手系統中的命令識別
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase