L

Llama 3.1 Minitron 4B Width Base

由nvidia開發
Llama-3.1-Minitron-4B-Width-Base是一個基礎文本到文本模型,通過對Llama-3.1-8B進行剪枝獲得,適用於多種自然語言生成任務。
下載量 10.15k
發布時間 : 8/13/2024

模型概述

該模型通過對Llama-3.1-8B進行剪枝獲得,剪枝了模型的嵌入大小和MLP中間維度,並使用940億個標記進行蒸餾持續訓練,最終得到該模型。

模型特點

剪枝優化
通過對Llama-3.1-8B進行剪枝,優化了模型的嵌入大小和MLP中間維度,提高了效率。
蒸餾訓練
使用940億個標記進行蒸餾持續訓練,提升了模型的性能。
商業用途
該模型已準備好用於商業用途,適用於多種自然語言生成任務。

模型能力

文本生成
自然語言理解
代碼生成

使用案例

自然語言處理
文本補全
用於自動補全段落或句子,提升寫作效率。
在8000個字符以內效果最佳。
問答系統
用於構建問答系統,回答用戶提出的問題。
在零樣本評估中表現良好。
代碼生成
代碼補全
用於自動補全代碼片段,提升開發效率。
在MBPP評估中得分為32.0。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase