wav2vec2-large-xlsr-53-english開源語音識別模型

首頁

Wav2vec2 Large Xlsr 53 English

由Xenova開發

基於wav2vec 2.0架構的大規模語音識別模型，支持英語語音轉文本

語音識別

Transformers

#英語語音識別 #高精度轉寫 #ONNX優化

下載量 14

發布時間 : 7/26/2023

模型概述

該模型是基於Facebook的wav2vec 2.0架構開發的自動語音識別(ASR)模型，專門針對英語語音進行優化，能夠將英語語音準確轉換為文本。

模型特點

高精度英語識別

針對英語語音優化的模型，提供高準確率的語音轉文本能力

基於wav2vec 2.0架構

採用Facebook開發的先進語音識別架構，具有強大的特徵提取能力

Web兼容性

提供ONNX格式權重，便於在Web環境中部署和使用

模型能力

英語語音識別

即時語音轉文本

音頻文件轉錄

使用案例

語音轉錄

會議記錄

將英語會議錄音自動轉換為文字記錄

提高會議記錄效率，便於後續檢索和分析

播客轉錄

將英語播客內容轉換為文本

便於內容索引和文字版發佈

輔助工具

即時字幕生成

為英語視頻或直播生成即時字幕

提高內容可訪問性

屬性	詳情
基礎模型	jonatasgrosman/wav2vec2-large-xlsr-53-english
庫名稱	transformers.js

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Wav2vec2 Large Xlsr 53 English

模型概述

模型特點

模型能力

使用案例

🚀 語音識別模型

🚀 快速開始

📦 安裝指南

💻 使用示例

基礎用法

📚 詳細文檔