M

Menlo Jan Nano GGUF

由 bartowski 开发
基于llama.cpp对Menlo/Jan - nano模型进行量化处理,提供多种量化类型的模型文件,以满足不同硬件和性能需求。
下载量 190
发布时间 : 6/15/2025

模型简介

该项目提供了Menlo/Jan - nano模型的多种量化版本,适用于不同硬件配置和使用场景,支持在LM Studio或llama.cpp等工具中运行。

模型特点

多种量化类型
提供如bf16、Q8_0、Q6_K_L等多种量化类型的模型文件,用户可根据硬件和性能需求选择。
优化权重处理
部分量化模型采用了将嵌入和输出权重量化为Q8_0的标准量化方法,以提高性能。
在线重打包功能
支持部分量化模型在线重打包权重,以提高在ARM和AVX机器上的性能。

模型能力

文本生成
多语言支持
低内存运行

使用案例

自然语言处理
对话系统
可用于构建对话系统,支持多轮对话。
文本生成
适用于各种文本生成任务,如文章创作、代码生成等。
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase