低參數量高效

# 低參數量高效

Qwen3 0.6B GGUF

Qwen3是通義千問系列最新一代大語言模型，提供完整稠密模型與混合專家（MoE）架構。經過海量訓練，Qwen3在推理、指令遵循、智能體能力和多語言支持方面實現突破性進展。

大型語言模型

Granite Speech 3.3 8b

專為自動語音識別(ASR)和自動語音翻譯(AST)設計的緊湊高效語音語言模型，採用雙階段設計處理音頻和文本

文本生成音頻

Transformers 英語

Qwen2.5 VL 3B UI R1

UI-R1是通過強化學習增強GUI代理動作預測的視覺語言模型，基於Qwen2.5-VL-3B-Instruct構建。

文本生成圖像英語

Qwen2 VL 2B Instruct

Qwen2-VL-2B-Instruct 是一個多模態視覺語言模型，支持圖像文本到文本的任務。

圖像生成文本

Transformers 英語

Llama 3.2是Meta推出的多語言大語言模型系列，包含1B和3B參數的預訓練及指令調優生成模型，針對多語言對話場景優化，支持代理檢索和摘要任務。

大型語言模型

Transformers 支持多種語言

Whisper Large V3 Distil Fr V0.2

專為法語語音轉文本優化的Whisper蒸餾版本，僅保留2層解碼器結構，在保證準確率的同時提升推理效率

Transformers 法語

Ruri Reranker Small

Ruri-Reranker是一個專門針對日語文本優化的重排序模型，基於sentence-transformers架構，能夠有效提升檢索結果的相關性排序。

文本嵌入日語

Bert Medium Amharic

基於bert-medium架構預訓練的阿姆哈拉語模型，參數量4050萬，在2.9億詞元上訓練，性能媲美更大規模的多語言模型。

大型語言模型

Transformers 其他

小駱駝模型是一個5800萬參數的語言模型，由LLaMA和GPT2蒸餾而來，專為小語言模型挑戰賽設計。

大型語言模型

Transformers 英語

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase