M

Mistral NeMo Minitron 8B Base

Developed by nvidia
Mistral-NeMo-Minitron-8B-Base是一個基礎的文本生成模型,通過對Mistral-NeMo 12B進行剪枝和蒸餾得到,適用於多種自然語言生成任務。
Downloads 7,924
Release Time : 8/19/2024

Model Overview

該模型是一個大語言模型(LLM),通過對Mistral-NeMo 12B進行剪枝和蒸餾得到,能有效處理各類文本任務,為自然語言處理提供強大支持。

Model Features

剪枝與蒸餾優化
通過對Mistral-NeMo 12B進行剪枝和蒸餾得到,減少了模型規模同時保持性能
高效訓練
剪枝後使用3800億個標記進行蒸餾式持續訓練,優化模型性能
先進架構
採用分組查詢注意力(GQA)和旋轉位置嵌入(RoPE)等先進技術

Model Capabilities

文本生成
段落補全
語言理解
代碼生成

Use Cases

內容生成
段落補全
根據提示補全段落內容
生成連貫的後續文本
教育
科學知識問答
回答關於科學領域的問題
提供準確的科學知識解釋
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase