# GQA高效推理

Llama 3.3 70b Instruct Awq
Llama 3.3是Meta開發的多語言大語言模型,擁有700億參數,針對多語言對話用例優化,在多項基準測試中表現優異。
大型語言模型 Transformers 支持多種語言
L
casperhansen
47.12k
32
Llama 3.2 1B Instruct QLORA INT4 EO8
Llama 3.2 是 Meta 推出的多語言大語言模型系列,包含 1B 和 3B 參數的預訓練和指令微調版本,支持 8 種官方語言,優化了多語言對話場景。
大型語言模型 PyTorch 支持多種語言
L
meta-llama
286
41
Llama 3.2 90B Vision Instruct
Llama 3.2-Vision是Meta開發的多模態大語言模型,支持圖像和文本輸入,文本輸出,在視覺識別、圖像推理、圖像描述和圖像問答任務上表現優異。
圖像生成文本 Transformers 支持多種語言
L
meta-llama
15.44k
337
Llama 3.1 Minitron 4B Width Base
其他
Llama-3.1-Minitron-4B-Width-Base是一個基礎文本到文本模型,通過對Llama-3.1-8B進行剪枝獲得,適用於多種自然語言生成任務。
大型語言模型 Transformers 英語
L
nvidia
10.15k
190
Minitron 8B Base
其他
Minitron-8B-Base是通過剪裁Nemotron-4 15B獲得的大型語言模型,採用蒸餾持續訓練方法,相比從頭訓練節省了40倍的訓練token和1.8倍的計算成本。
大型語言模型 Transformers 英語
M
nvidia
5,725
66
Llama 3.1 8B
Meta Llama 3.1 是一個多語言大語言模型系列,包含8B、70B和405B三種規模的預訓練及指令調優生成模型,針對多語言對話場景優化。
大型語言模型 Transformers 支持多種語言
L
meta-llama
1.0M
1,583
Meta Llama 3 70B
Meta發佈的Llama 3系列大語言模型,包含8B和70B兩種規模的預訓練及指令調優生成式文本模型,針對對話場景優化,在行業基準測試中表現優異。
大型語言模型 Transformers 英語
M
meta-llama
15.32k
857
Llama 2 70b Chat Hf
Meta開源的700億參數對話優化大語言模型,在安全性和實用性上媲美主流閉源模型
大型語言模型 Transformers 英語
L
meta-llama
34.78k
2,187
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase