M

Mistral NeMo Minitron 8B Base

由 nvidia 开发
Mistral-NeMo-Minitron-8B-Base是一个基础的文本生成模型,通过对Mistral-NeMo 12B进行剪枝和蒸馏得到,适用于多种自然语言生成任务。
下载量 7,924
发布时间 : 8/19/2024

模型简介

该模型是一个大语言模型(LLM),通过对Mistral-NeMo 12B进行剪枝和蒸馏得到,能有效处理各类文本任务,为自然语言处理提供强大支持。

模型特点

剪枝与蒸馏优化
通过对Mistral-NeMo 12B进行剪枝和蒸馏得到,减少了模型规模同时保持性能
高效训练
剪枝后使用3800亿个标记进行蒸馏式持续训练,优化模型性能
先进架构
采用分组查询注意力(GQA)和旋转位置嵌入(RoPE)等先进技术

模型能力

文本生成
段落补全
语言理解
代码生成

使用案例

内容生成
段落补全
根据提示补全段落内容
生成连贯的后续文本
教育
科学知识问答
回答关于科学领域的问题
提供准确的科学知识解释
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase