wav2vec2架構

# wav2vec2架構

Japanese Wav2vec2 Base

由rinna株式會社訓練的日語wav2vec 2.0基礎模型，基於ReazonSpeech數據集訓練

Transformers 日語

Wav2vec2 Base Finetuned Amd

該模型是基於facebook/wav2vec2-base在未知數據集上微調的版本，主要用於語音識別任務，在評估集上達到84.55%的準確率。

Wav2vec2 Large Xlsr 53 Gender Recognition Librispeech

基於Librispeech-clean-100數據集微調的性別識別模型，在測試集上F1分數達0.9993

Wav2vec2 Spoof Dection1

基於facebook/wav2vec2-base在asvspoof2019數據集上微調的語音防偽檢測模型

Wav2vec2 Base Vi Vlsp2020

基於wav2vec2架構的越南語自動語音識別模型，預訓練於13,000小時未標註YouTube音頻，並在250小時標註數據上微調。

Transformers 其他

Wav2vec2 Conformer Rel Pos Large 960h Ft Intent Classification Ori

該模型是基於facebook/wav2vec2-conformer-rel-pos-large-960h-ft微調的語音意圖分類模型，在評估集上準確率達到58.33%。

MuhammadIqbalBazmi

Wav2vec2 Base Finetuned Ks

基於facebook/wav2vec2-base模型微調的語音識別模型，在評估集上準確率達到87.27%。

Exp W2v2t Sv Se R Wav2vec2 S418

基於facebook/wav2vec2-large-robust模型微調的瑞典語自動語音識別模型，支持16kHz採樣率語音輸入。

Exp W2v2t Fr Vp Fr S438

基於facebook/wav2vec2-large-fr-voxpopuli模型微調的法語自動語音識別模型，使用Common Voice 7.0法語數據集訓練。

Transformers 法語

Exp W2v2t Th Wav2vec2 S664

基於facebook/wav2vec2-large-lv60模型微調的泰語語音識別模型，使用Common Voice 7.0數據集訓練

Transformers 其他

基於facebook/wav2vec2-base-960h微調的語音識別模型

基於facebook/wav2vec2-base-960h微調的語音識別模型，在評估集上詞錯誤率為1.0

該模型是基於facebook/wav2vec2-base微調的語音識別模型，在評估集上取得了0.4949的詞錯誤率。

Wav2vec2 Base Timit Demo Colab240

基於facebook/wav2vec2-base模型微調的語音識別模型，在TIMIT數據集上進行了訓練

My Final Wav2vec2 Urdu Asr Project

這是一個基於wav2vec2架構的烏爾都語自動語音識別(ASR)模型，從頭開始訓練。

Wav2vec2 Base Timit Demo Colab3

該模型是基於facebook/wav2vec2-base進行微調的語音識別模型，在TIMIT數據集上取得了0.6704的詞錯誤率。

Wav2vec2 Base Timit Demo Colab

基於wav2vec2-base模型在TIMIT數據集上微調的語音識別模型

Common Voice Lithuanian Fairseq

基於Common Voice數據集訓練的立陶宛語自動語音識別模型，使用wav2vec2架構和fairseq框架實現。

Transformers 其他

Wav2vec2 Base Toy Train Data Random High Pass

基於facebook/wav2vec2-base在空數據集上微調的語音識別模型，使用了隨機高通濾波技術處理訓練數據

Wav2vec2 Pretrained Clsril 23 10k

基於自監督學習的音頻預訓練模型，能夠從23種印度語言的原始音頻中學習跨語言語音表徵

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase