W

Wav2vec2 Large Xlsr 53 English

由Xenova開發
基於wav2vec 2.0架構的大規模語音識別模型,支持英語語音轉文本
下載量 14
發布時間 : 7/26/2023

模型概述

該模型是基於Facebook的wav2vec 2.0架構開發的自動語音識別(ASR)模型,專門針對英語語音進行優化,能夠將英語語音準確轉換為文本。

模型特點

高精度英語識別
針對英語語音優化的模型,提供高準確率的語音轉文本能力
基於wav2vec 2.0架構
採用Facebook開發的先進語音識別架構,具有強大的特徵提取能力
Web兼容性
提供ONNX格式權重,便於在Web環境中部署和使用

模型能力

英語語音識別
即時語音轉文本
音頻文件轉錄

使用案例

語音轉錄
會議記錄
將英語會議錄音自動轉換為文字記錄
提高會議記錄效率,便於後續檢索和分析
播客轉錄
將英語播客內容轉換為文本
便於內容索引和文字版發佈
輔助工具
即時字幕生成
為英語視頻或直播生成即時字幕
提高內容可訪問性
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase