英語語音處理

# 英語語音處理

Wav2vec2 Base Librispeech Demo Colab

該模型是基於facebook/wav2vec2-base在LibriSpeech數據集上微調的語音識別模型，在評估集上取得了0.3174的詞錯誤率。

Distil Large V3.5 ONNX

Distil-Whisper是OpenAI Whisper-Large-v3的知識蒸餾版本，提供更優的性能表現和高效性。

Transformers 英語

Ichigo Llama3.1 S Instruct V0.3 Phase 3

Ichigo-llama3s是一個支持音頻和文本輸入的大語言模型系列，專注於提升聲音理解能力和用戶交互體驗。

文本生成音頻英語

WhisperNER是一種能夠同時進行語音轉錄和實體識別的新穎模型，支持開放類型的命名實體識別（NER）。

語音識別支持多種語言

Phoneme Scorer V2 Wav2vec2

基於Wav2Vec2-Base架構的自動語音識別模型，專門用於音素識別，在LJSpeech Phonemes數據集上微調

Transformers 英語

ct-vikramanantha

Wav2vec2 Large Lv60 Phoneme Timit English Timit 4k 002

基於facebook/wav2vec2-large-lv60在TIMIT數據集上微調的英語音素識別模型，音素錯誤率10.53%

Transformers 英語

Wav2vec2 Large Lv60 Phoneme Timit English Timit 4k

基於facebook/wav2vec2-large-lv60微調的英語音素識別模型，在TIMIT數據集上取得10.53%的音素錯誤率

Transformers 英語

Gazelle v0.2 是由 Tincans 發佈的聯合語音-語言模型，支持英語。

文本生成音頻

Transformers 英語

Wav2vec2 Large Xlsr 53 English Finetuned Ravdess

基於wav2vec2-large-xlsr-53-english模型在RAVDESS數據集上微調的語音情感識別模型

Wav2vec2 Lg Xlsr En Speech Emotion Recognition Finetuned Ravdess V8

基於wav2vec2架構的英語語音情感識別模型，在RAVDESS數據集上微調

Wav2vec2 Base Speech Emotion Recognition

基於facebook/wav2vec2-base微調的語音情感識別模型，用於預測音頻樣本中說話者的情感。

Transformers 英語

Wav2vec2 Ljspeech Gruut

基於Wav2Vec2架構的音素識別模型，在LJSpeech Phonemes數據集上微調，用於將語音轉換為音素序列

Transformers 英語

Wav2vec2 Large 960h Intent Classification Ori

基於facebook/wav2vec2-large-960h微調的意圖分類模型，在評估集上準確率達77.08%

MuhammadIqbalBazmi

Wav2vec2 Large Tedlium

基於TEDLIUM語料庫微調的Wav2Vec2大型語音識別模型，支持英語語音轉文本

語音識別英語

Wav2vec2 Base Timit Demo Google Colab

該模型是基於facebook/wav2vec2-base在TIMIT數據集上微調的語音識別模型，在Google Colab環境下訓練完成。

Wav2vec2 Base Timit Demo Colab

基於facebook/wav2vec2-base模型在TIMIT數據集上微調的語音識別模型，具有較低的詞錯誤率(WER)。

Wav2vec2 Base Timit Demo Google Colab

基於facebook/wav2vec2-base在TIMIT數據集上微調的語音識別模型，專注於英語語音轉文字任務

基於facebook/wav2vec2-base-960h微調的語音識別模型

基於facebook/wav2vec2-base-960h微調的語音識別模型，在評估集上詞錯誤率為1.0

Wav2vec2 Base Dataset Asr Demo Colab

這是一個基於distilhubert在superb數據集上微調的語音識別模型，主要用於自動語音識別(ASR)任務。

Wav2vec2 Base Timit Demo Google Colab

該模型是基於facebook/wav2vec2-base在TIMIT數據集上微調的語音識別模型，在評估集上取得了0.3384的詞錯誤率(WER)。

Assignment1 Francesco

基於語音到文本轉換器(S2T)訓練的自動語音識別(ASR)模型，專為英語語音識別設計

Transformers 英語

Classroom-workshop

基於facebook/wav2vec2-base微調的語音識別模型，支持自動語音轉文字任務

基於facebook/wav2vec2-xls-r-300m在librispeech_asr數據集上微調的英語語音識別模型

Wav2vec2 Base Timit Demo Google Colab

該模型是基於facebook/wav2vec2-base在TIMIT數據集上微調的語音識別模型，專注於英語語音轉文字任務。

Wav2vec2 Base Timit Google Colab

基於facebook/wav2vec2-base在空數據集上微調的語音識別模型，在評估集上取得了0.3355的詞錯誤率(WER)。

該模型是基於facebook/wav2vec2-base微調的語音識別模型，在評估集上取得了0.52的詞錯誤率。

該模型是基於facebook/wav2vec2-base-960h微調的語音識別模型，在評估集上詞錯誤率(WER)為1.0。

Wav2vec2 Base Timit Demo Google Colab

基於facebook/wav2vec2-base在TIMIT數據集上微調的語音識別模型，適用於英語語音轉文本任務

Wav2vec2 Base Timit Demo Google Colab

該模型是基於facebook/wav2vec2-base在TIMIT數據集上微調的語音識別模型，主要用於英語語音轉文字任務。

patrickvonplaten

Wav2vec2 Base Timit Demo Colab92

基於facebook/wav2vec2-base模型在TIMIT數據集上微調的語音識別模型

Wav2vec2 Base Timit Demo Colab90

基於facebook/wav2vec2-base模型在TIMIT數據集上微調的語音識別模型，專注於英語語音轉文本任務

Wav2vec2 Base Timit Demo Colab11

該模型是基於facebook/wav2vec2-base進行微調的語音識別模型，在TIMIT數據集上取得了0.4348的詞錯誤率。

Wav2vec2 Base Timit Demo Colab 1

該模型是基於facebook/wav2vec2-base微調的語音識別模型，在TIMIT數據集上訓練，詞錯誤率(WER)為0.4398。

Wav2vec2 Base Timit Demo Colab2

該模型是基於facebook/wav2vec2-base微調得到的語音識別模型，在評估集上取得了0.5664的詞錯誤率(WER)。

Wav2vec2 Base Timit Ali Hasan Colab EX2

基於facebook/wav2vec2-base微調的語音識別模型，在TIMIT數據集上訓練，評估集WER為0.4458

Wav2vec2 Base Timit Ali Hasan Colab

基於facebook/wav2vec2-base微調的語音識別模型，在TIMIT數據集上訓練

Wav2vec2 Base Timit Moaiz Exp2

基於facebook/wav2vec2-base模型在TIMIT數據集上微調的語音識別模型

Wav2vec2 Base Timit Demo Colab

基於wav2vec2-base模型在TIMIT數據集上微調的語音識別模型

Wav2vec2 Base Timit Demo Colab

基於facebook/wav2vec2-base模型微調的語音識別模型，在TIMIT數據集上進行了訓練和評估。

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase