低参数量高效

# 低参数量高效

Qwen3 0.6B GGUF

Qwen3是通义千问系列最新一代大语言模型，提供完整稠密模型与混合专家（MoE）架构。经过海量训练，Qwen3在推理、指令遵循、智能体能力和多语言支持方面实现突破性进展。

大型语言模型

Granite Speech 3.3 8b

专为自动语音识别(ASR)和自动语音翻译(AST)设计的紧凑高效语音语言模型，采用双阶段设计处理音频和文本

文本生成音频

Transformers 英语

Qwen2.5 VL 3B UI R1

UI-R1是通过强化学习增强GUI代理动作预测的视觉语言模型，基于Qwen2.5-VL-3B-Instruct构建。

文本生成图像英语

Qwen2 VL 2B Instruct

Qwen2-VL-2B-Instruct 是一个多模态视觉语言模型，支持图像文本到文本的任务。

图像生成文本

Transformers 英语

Llama 3.2是Meta推出的多语言大语言模型系列，包含1B和3B参数的预训练及指令调优生成模型，针对多语言对话场景优化，支持代理检索和摘要任务。

大型语言模型

Transformers 支持多种语言

Whisper Large V3 Distil Fr V0.2

专为法语语音转文本优化的Whisper蒸馏版本，仅保留2层解码器结构，在保证准确率的同时提升推理效率

Transformers 法语

Ruri Reranker Small

Ruri-Reranker是一个专门针对日语文本优化的重排序模型，基于sentence-transformers架构，能够有效提升检索结果的相关性排序。

文本嵌入日语

Bert Medium Amharic

基于bert-medium架构预训练的阿姆哈拉语模型，参数量4050万，在2.9亿词元上训练，性能媲美更大规模的多语言模型。

大型语言模型

Transformers 其他

小骆驼模型是一个5800万参数的语言模型，由LLaMA和GPT2蒸馏而来，专为小语言模型挑战赛设计。

大型语言模型

Transformers 英语

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

English 简体中文繁體中文にほんご

© 2025AIbase