# 语音指令识别

Whisper Large V3 Turbo Turkish
MIT
基于openai/whisper-large-v3-turbo在Common Voice 17.0数据集上微调的土耳其语语音识别模型
语音识别 Transformers 其他
W
selimc
289
6
Hubert Base Superb Ks
基于HuBERT架构的语音指令识别模型,专为关键词识别任务优化
音频分类 Transformers
H
Xenova
17
1
Wav2vec Fine Tuned Speech Command2
Apache-2.0
基于facebook/wav2vec2-base在speech_commands数据集上微调的语音识别模型,准确率达97.35%
音频分类 Transformers
W
Thamer
16
0
Ast Finetuned Speech Commands V2
基于AST架构的语音命令识别模型,专为网页端部署优化的ONNX格式版本
音频分类 Transformers
A
Xenova
15
0
Speechcommand Demo
Apache-2.0
基于facebook/wav2vec2-base微调的语音命令分类模型,在superb数据集上训练,准确率达98.09%
音频分类 Transformers
S
SHENMU007
18
0
Wav2vec2 Base Finetuned Speech Commands V0.02
Apache-2.0
该模型是基于facebook/wav2vec2-base在speech_commands数据集上微调的语音命令识别模型,准确率达97.59%。
音频分类 Transformers
W
0xb1
1.2M
0
Wav2vec2 Base Finetuned Ks
Apache-2.0
基于facebook/wav2vec2-base模型在speech_commands数据集上微调的语音识别模型,准确率达97.8%
音频分类 Transformers
W
Dc26
23
2
MIT Ast Finetuned Speech Commands V2 Ov
这是一个基于MIT/ast-finetuned-speech-commands-v2转换的OpenVINO优化版本,用于加速语音指令识别任务的推理运算。
音频分类 Transformers 英语
M
helenai
514
0
0 9up Ast Ft
Bsd-3-clause
该模型是基于MIT/ast-finetuned-speech-commands-v2在数字语音命令数据集上微调的音频分类模型,主要用于识别0-9数字语音命令
音频分类 Transformers
0
mazkooleg
19
0
Ast Finetuned Speech Commands V2
Bsd-3-clause
基于Speech Commands v2数据集微调的音频频谱图变换器模型,用于音频分类任务,准确率达98.12%。
音频分类 Transformers
A
MIT
10.94k
15
Hubert Large Superb Ks
Apache-2.0
基于Hubert-Large架构的关键词检测模型,在SUPERB基准测试中表现优异
语音识别 Transformers 英语
H
superb
78
0
Wav2vec2 Large Superb Ks
Apache-2.0
基于Wav2Vec2-Large-LV60预训练模型,在SUPERB关键词检测任务上微调的语音分类模型
语音识别 Transformers 英语
W
superb
18
1
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase