english-model開源英語語音識別模型 - 支持16kHz語音輸入，精準識別更實用

Home

English Model

Developed by tanmayplanet32

基於facebook/wav2vec2-large模型，使用Common Voice數據集進行英語微調的語音識別模型，支持16kHz採樣率的語音輸入。

語音識別

Transformers

#英語語音識別 #16kHz採樣率 #Common Voice微調

Downloads 30

Release Time : 3/2/2022

Model Overview

這是一個針對英語優化的自動語音識別(ASR)模型，能夠將英語語音轉換為文本。

Model Features

英語優化

使用Common Voice數據集進行微調，針對英語語音識別進行了優化

16kHz採樣率支持

專門支持16kHz採樣率的語音輸入

基於wav2vec2架構

採用先進的wav2vec2架構，提供高質量的語音識別能力

Model Capabilities

英語語音識別

語音轉文本

自動語音轉錄

Use Cases

語音轉錄

會議記錄自動轉錄

將英語會議錄音自動轉換為文字記錄

提高會議記錄效率，減少人工轉錄時間

播客內容轉錄

將英語播客內容自動轉換為文本

便於內容搜索和存檔

輔助技術

語音輸入系統

為殘障人士提供語音轉文字輸入功能

提高可訪問性

Featured Recommended AI Models

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers Supports Multiple Languages

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統 Chinese

uer

2,694

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

English Model

Model Overview

Model Features

Model Capabilities

Use Cases

🚀 Wav2vec2-Large-English

🚀 快速開始