M

Menlo Jan Nano GGUF

由bartowski開發
基於llama.cpp對Menlo/Jan - nano模型進行量化處理,提供多種量化類型的模型文件,以滿足不同硬件和性能需求。
下載量 190
發布時間 : 6/15/2025

模型概述

該項目提供了Menlo/Jan - nano模型的多種量化版本,適用於不同硬件配置和使用場景,支持在LM Studio或llama.cpp等工具中運行。

模型特點

多種量化類型
提供如bf16、Q8_0、Q6_K_L等多種量化類型的模型文件,用戶可根據硬件和性能需求選擇。
優化權重處理
部分量化模型採用了將嵌入和輸出權重量化為Q8_0的標準量化方法,以提高性能。
在線重打包功能
支持部分量化模型在線重打包權重,以提高在ARM和AVX機器上的性能。

模型能力

文本生成
多語言支持
低內存運行

使用案例

自然語言處理
對話系統
可用於構建對話系統,支持多輪對話。
文本生成
適用於各種文本生成任務,如文章創作、代碼生成等。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase