M

Mistral NeMo Minitron 8B Base

由nvidia開發
Mistral-NeMo-Minitron-8B-Base是一個基礎的文本生成模型,通過對Mistral-NeMo 12B進行剪枝和蒸餾得到,適用於多種自然語言生成任務。
下載量 7,924
發布時間 : 8/19/2024

模型概述

該模型是一個大語言模型(LLM),通過對Mistral-NeMo 12B進行剪枝和蒸餾得到,能有效處理各類文本任務,為自然語言處理提供強大支持。

模型特點

剪枝與蒸餾優化
通過對Mistral-NeMo 12B進行剪枝和蒸餾得到,減少了模型規模同時保持性能
高效訓練
剪枝後使用3800億個標記進行蒸餾式持續訓練,優化模型性能
先進架構
採用分組查詢注意力(GQA)和旋轉位置嵌入(RoPE)等先進技術

模型能力

文本生成
段落補全
語言理解
代碼生成

使用案例

內容生成
段落補全
根據提示補全段落內容
生成連貫的後續文本
教育
科學知識問答
回答關於科學領域的問題
提供準確的科學知識解釋
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase