# 英语音频处理

Qwen2 Audio 7B Instruct I1 GGUF
Apache-2.0
Qwen2-Audio-7B-Instruct的加权/矩阵量化模型,支持英文音频文本转文本任务
文本生成音频 Transformers 英语
Q
mradermacher
282
0
Qwen2 Audio 7B Instruct GGUF
Apache-2.0
Qwen2-Audio-7B-Instruct模型的静态量化版本,支持英文音频文本转文本任务
音频生成文本 Transformers 英语
Q
mradermacher
146
0
My Awesome Mind Model
Apache-2.0
基于facebook/wav2vec2-base模型在minds14数据集上微调的音频分类模型
音频分类 Transformers
M
Gyaneshere
4
0
Ichigo Llama3.1 S Instruct V0.4 GGUF
Apache-2.0
基于Menlo/Ichigo-llama3.1-s-instruct-v0.4的静态量化模型,提供多种量化版本,适用于不同硬件需求。
大型语言模型 英语
I
mradermacher
369
1
My Awesome Mind Model
Apache-2.0
基于facebook/wav2vec2-base在minds14数据集上微调的音频分类模型
音频分类 Transformers
M
faaany
1
0
Mini Ichigo Llama3.2 3B S Instruct
Apache-2.0
Ichigo-llama3s系列模型是由Homebrew Research开发的多模态语言模型,原生支持音频和文本输入理解。该模型基于Llama-3架构,通过WhisperVQ作为音频文件标记器进行训练,提升了音频理解能力。
文本生成音频 Safetensors 英语
M
Menlo
22
34
Speech Accent Classification
Apache-2.0
基于Wav2Vec2架构的语音识别基础模型,在960小时的英语语音数据上训练,适用于语音分类任务。
音频分类 Transformers 英语
S
dima806
40
4
Wav2vec2 Gpt2 Wandb Grid Search
基于LibriSpeech数据集训练的自动语音识别(ASR)模型
语音识别 Transformers
W
sanchit-gandhi
13
0
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase