# 低参数量高效

Qwen3 0.6B GGUF
Apache-2.0
Qwen3是通义千问系列最新一代大语言模型,提供完整稠密模型与混合专家(MoE)架构。经过海量训练,Qwen3在推理、指令遵循、智能体能力和多语言支持方面实现突破性进展。
大型语言模型
Q
Qwen
2,511
5
Granite Speech 3.3 8b
Apache-2.0
专为自动语音识别(ASR)和自动语音翻译(AST)设计的紧凑高效语音语言模型,采用双阶段设计处理音频和文本
文本生成音频 Transformers 英语
G
ibm-granite
5,532
35
Qwen2.5 VL 3B UI R1
MIT
UI-R1是通过强化学习增强GUI代理动作预测的视觉语言模型,基于Qwen2.5-VL-3B-Instruct构建。
文本生成图像 英语
Q
LZXzju
96
6
Qwen2 VL 2B Instruct
Apache-2.0
Qwen2-VL-2B-Instruct 是一个多模态视觉语言模型,支持图像文本到文本的任务。
图像生成文本 Transformers 英语
Q
FriendliAI
24
1
Llama 3.2 1B
Llama 3.2是Meta推出的多语言大语言模型系列,包含1B和3B参数的预训练及指令调优生成模型,针对多语言对话场景优化,支持代理检索和摘要任务。
大型语言模型 Transformers 支持多种语言
L
meta-llama
2.1M
1,866
Whisper Large V3 Distil Fr V0.2
MIT
专为法语语音转文本优化的Whisper蒸馏版本,仅保留2层解码器结构,在保证准确率的同时提升推理效率
语音识别 Transformers 法语
W
bofenghuang
385
2
Ruri Reranker Small
Apache-2.0
Ruri-Reranker是一个专门针对日语文本优化的重排序模型,基于sentence-transformers架构,能够有效提升检索结果的相关性排序。
文本嵌入 日语
R
cl-nagoya
116
2
Bert Medium Amharic
基于bert-medium架构预训练的阿姆哈拉语模型,参数量4050万,在2.9亿词元上训练,性能媲美更大规模的多语言模型。
大型语言模型 Transformers 其他
B
rasyosef
2,661
1
Baby Llama 58m
小骆驼模型是一个5800万参数的语言模型,由LLaMA和GPT2蒸馏而来,专为小语言模型挑战赛设计。
大型语言模型 Transformers 英语
B
timinar
442
11
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase