語音識別

# 語音識別

Ultravox V0 5 Llama 3 2 1b GGUF

Ultravox v0.5是基於Llama-3 2.1B架構優化的音頻文本轉文本模型，專注於高效處理語音轉寫任務。

Wav2vec2 Base Librispeech Demo Colab

該模型是基於facebook/wav2vec2-base在LibriSpeech數據集上微調的語音識別模型，在評估集上取得了0.3174的詞錯誤率。

Hubert Base Librispeech Demo Colab

基於facebook/hubert-large-ls960-ft微調的語音識別模型，在LibriSpeech數據集上訓練

Wav2vec Checkpoints

基於facebook/wav2vec2-base微調的語音處理模型，在評估集上準確率達99.48%

Zeyadd-Mostaffa

Deepfake Audio Detection

基於wav2vec2-base-finetuned進一步微調的語音處理模型，在評估集上準確率達98.82%

Deepfake Audio Detection

基於wav2vec2-base-finetuned模型微調的語音處理模型，在評估集上準確率達98.82%

Wav2vec2 Phoneme

基於facebook/wav2vec2-large-xlsr-53微調的語音識別模型，專注於音素識別任務

Wav2vec2 Base Finetuned

基於facebook/wav2vec2-base模型微調的語音處理模型，在評估集上達到99.97%的準確率

Wav2vec2 Base Finetuned

基於facebook/wav2vec2-base模型微調的語音處理模型，在評估集上準確率達99.97%

Wav2vec2 Base Finetuned Ks

基於wav2vec2-base模型在音頻文件夾數據集上微調的音頻分類模型，驗證集準確率達99.82%

Whisper Small Dialect Classifier Cross

該模型是基於whisper-small架構的方言分類器，用於識別和分類特定方言的語音輸入。

Bsc Ai Thesis Torgo Model 1

基於facebook/wav2vec2-base微調的語音處理模型，在評估集上表現出色

Neunit Ks Kangyuan0601

該模型是基於facebook/wav2vec2-base在superb數據集上微調的音頻分類模型，在評估集上取得了99.87%的準確率。

Wav2vec2 Base Finetuned Amd

該模型是基於facebook/wav2vec2-base在未知數據集上微調的版本，主要用於語音識別任務，在評估集上達到84.55%的準確率。

Audio Class Finetuned

該模型是基於facebook/wav2vec2-base在superb數據集上微調的音頻分類模型，在評估集上取得了0.6578的準確率。

Wav2vec2 Base Finetuned Ks

基於facebook/wav2vec2-base在superb數據集上微調的語音識別模型，準確率達98.34%

Whisper Small ISSAI KSC 335RS V2

基於Whisper架構的小型語音識別模型，適用於特定領域的語音轉文本任務

該模型是基於facebook/wav2vec2-xls-r-300m微調的語音識別模型，主要用於英語語音轉文本任務。

Wav2vec2 Base Finetuned Ks

該模型是基於facebook/wav2vec2-base在superb數據集上微調的語音識別模型，在關鍵詞識別任務上表現出色。

Wav2vec2 Base Finetuned Ie

基於facebook/wav2vec2-base模型微調的版本，用於特定任務

Wav2vec2 Base Finetuned Ks

基於facebook/wav2vec2-base模型微調的語音識別模型，在評估集上準確率達到87.27%。

Wav2vec2 Base Timit Demo Google Colab

該模型是基於facebook/wav2vec2-base在TIMIT數據集上微調的語音識別模型，在Google Colab環境下訓練完成。

Wav2vec2 Base Timit Demo Google Colab

該模型是基於facebook/wav2vec2-base的微調版本，主要用於語音識別任務。

Wav2vec2 Base Timit Demo Google Colab

基於facebook/wav2vec2-base模型在TIMIT數據集上微調的語音識別模型

Wav2vec2 Base Timit Demo Colab

基於facebook/wav2vec2-base模型在TIMIT數據集上微調的語音識別模型，具有較低的詞錯誤率(WER)。

Wav2vec2 Base Timit Demo Google Colab

基於facebook/wav2vec2-base在TIMIT數據集上微調的語音識別模型，專注於英語語音轉文字任務

Wav2vec2 Base Timit Demo Google Colab

該模型是基於facebook/wav2vec2-base在TIMIT數據集上微調得到的語音識別模型，主要用於英語語音轉文本任務。

Wav2vec2 Base Ft Cv3 V3

該模型是基於facebook/wav2vec2-base在Common Voice 3.0英語數據集上微調的語音識別模型，在測試集上取得了0.247的詞錯誤率。

Wav2vec Trained

該模型是基於facebook/wav2vec2-base微調而成的語音識別模型，在評估集上取得了詞錯誤率0.1042的表現。

基於facebook/wav2vec2-base-960h微調的語音識別模型

基於facebook/wav2vec2-base-960h微調的語音識別模型，在評估集上詞錯誤率為1.0

基於facebook/wav2vec2-base微調的語音識別模型，在評估集上取得了0.3355的詞錯誤率(WER)。

Wav2vec2 Base Dataset Asr Demo Colab

這是一個基於distilhubert在superb數據集上微調的語音識別模型，主要用於自動語音識別(ASR)任務。

Test Demo Colab

這是一個自動生成的測試模型，主要用於演示和實驗目的。

大型語言模型

Wav2vec2 Base Timit Demo Google Colab

該模型是基於facebook/wav2vec2-base在TIMIT數據集上微調的語音識別模型，在評估集上取得了0.3384的詞錯誤率(WER)。

Wav2vec2 Keyword Spotting Int8

基於wav2vec2架構的語音關鍵詞檢測模型，已通過Optimum OpenVINO進行量化優化

Wac2vec Lllfantomlll

基於facebook/wav2vec2-base微調的語音識別模型，在評估集上取得了0.3417的詞錯誤率。

Wav2vec2 Base Vios Commonvoice 1

該模型是基於facebook/wav2vec2-xls-r-300m在Common Voice數據集上微調的語音識別模型，支持自動語音識別任務。

Wav2vec2 Base Timit Demo Colab53

基於facebook/wav2vec2-base模型微調的語音識別模型，適用於TIMIT數據集

Wav2vec2 Final 1 Lm 4

基於facebook/wav2vec2-base微調的語音識別模型，在評估集上詞錯誤率為0.4499

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase