english-model開源英語語音識別模型 - 支持16kHz語音輸入，精準識別更實用

首頁

English Model

由tanmayplanet32開發

基於facebook/wav2vec2-large模型，使用Common Voice數據集進行英語微調的語音識別模型，支持16kHz採樣率的語音輸入。

語音識別

Transformers

#英語語音識別 #16kHz採樣率 #Common Voice微調

下載量 30

發布時間 : 3/2/2022

模型概述

這是一個針對英語優化的自動語音識別(ASR)模型，能夠將英語語音轉換為文本。

模型特點

英語優化

使用Common Voice數據集進行微調，針對英語語音識別進行了優化

16kHz採樣率支持

專門支持16kHz採樣率的語音輸入

基於wav2vec2架構

採用先進的wav2vec2架構，提供高質量的語音識別能力

模型能力

英語語音識別

語音轉文本

自動語音轉錄

使用案例

語音轉錄

會議記錄自動轉錄

將英語會議錄音自動轉換為文字記錄

提高會議記錄效率，減少人工轉錄時間

播客內容轉錄

將英語播客內容自動轉換為文本

便於內容搜索和存檔

輔助技術

語音輸入系統

為殘障人士提供語音轉文字輸入功能

提高可訪問性

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

English Model

模型概述

模型特點

模型能力

使用案例

🚀 Wav2vec2-Large-English

🚀 快速開始