Whisper Large V3 Turbo Turkish
MIT
基于openai/whisper-large-v3-turbo在Common Voice 17.0数据集上微调的土耳其语语音识别模型
语音识别
Transformers 其他

W
selimc
289
6
Hubert Base Superb Ks
基于HuBERT架构的语音指令识别模型,专为关键词识别任务优化
音频分类
Transformers

H
Xenova
17
1
Wav2vec Fine Tuned Speech Command2
Apache-2.0
基于facebook/wav2vec2-base在speech_commands数据集上微调的语音识别模型,准确率达97.35%
音频分类
Transformers

W
Thamer
16
0
Ast Finetuned Speech Commands V2
基于AST架构的语音命令识别模型,专为网页端部署优化的ONNX格式版本
音频分类
Transformers

A
Xenova
15
0
Speechcommand Demo
Apache-2.0
基于facebook/wav2vec2-base微调的语音命令分类模型,在superb数据集上训练,准确率达98.09%
音频分类
Transformers

S
SHENMU007
18
0
Wav2vec2 Base Finetuned Speech Commands V0.02
Apache-2.0
该模型是基于facebook/wav2vec2-base在speech_commands数据集上微调的语音命令识别模型,准确率达97.59%。
音频分类
Transformers

W
0xb1
1.2M
0
Wav2vec2 Base Finetuned Ks
Apache-2.0
基于facebook/wav2vec2-base模型在speech_commands数据集上微调的语音识别模型,准确率达97.8%
音频分类
Transformers

W
Dc26
23
2
MIT Ast Finetuned Speech Commands V2 Ov
这是一个基于MIT/ast-finetuned-speech-commands-v2转换的OpenVINO优化版本,用于加速语音指令识别任务的推理运算。
音频分类
Transformers 英语

M
helenai
514
0
0 9up Ast Ft
Bsd-3-clause
该模型是基于MIT/ast-finetuned-speech-commands-v2在数字语音命令数据集上微调的音频分类模型,主要用于识别0-9数字语音命令
音频分类
Transformers

0
mazkooleg
19
0
Ast Finetuned Speech Commands V2
Bsd-3-clause
基于Speech Commands v2数据集微调的音频频谱图变换器模型,用于音频分类任务,准确率达98.12%。
音频分类
Transformers

A
MIT
10.94k
15
Hubert Large Superb Ks
Apache-2.0
基于Hubert-Large架构的关键词检测模型,在SUPERB基准测试中表现优异
语音识别
Transformers 英语

H
superb
78
0
Wav2vec2 Large Superb Ks
Apache-2.0
基于Wav2Vec2-Large-LV60预训练模型,在SUPERB关键词检测任务上微调的语音分类模型
语音识别
Transformers 英语

W
superb
18
1
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers 支持多种语言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers 英语

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统 中文
R
uer
2,694
98