SummLlama3.2-3B-GGUF开源摘要生成模型 - 多量化版适配不同硬件需求

首页

Summllama3.2 3B GGUF

由 tensorblock 开发

SummLlama3.2-3B是基于Llama3架构优化的3.2B参数摘要生成模型，提供多种量化版本以适应不同硬件需求。

大型语言模型 #文本摘要 #轻量级模型 #多格式量化

下载量 95

发布时间 : 11/20/2024

模型简介

专注于文本摘要任务的轻量级语言模型，提供从Q2_K到Q8_0多种量化选项，平衡性能与资源消耗。

模型特点

多级量化选项

提供从Q2_K(1.36GB)到Q8_0(3.42GB)共12种量化级别，满足不同硬件条件下的部署需求

优化的提示模板

采用结构化提示模板，明确区分系统指令和用户输入，提高摘要生成准确性

轻量高效

3.2B参数规模在保持质量的同时降低计算资源需求，适合边缘设备部署

模型能力

文本摘要生成

长文本压缩

关键信息提取

使用案例

内容处理

新闻摘要

自动生成新闻文章的核心内容摘要

可保留原文90%以上关键信息

会议纪要

从会议记录中提取决策点和行动项

研究辅助

论文摘要

自动生成学术论文的简明摘要

🚀 DISLab/SummLlama3.2-3B - GGUF

本项目包含 DISLab/SummLlama3.2-3B 的 GGUF 格式模型文件。这些文件是使用 TensorBlock 提供的机器进行量化的，并且与截至提交 b4011 的 llama.cpp 兼容。

反馈与支持：可通过 TensorBlock 的 Twitter/X、Telegram 群组和 Discord 服务器获取。

🚀 快速开始

项目信息

属性	详情
库名称	transformers
基础模型	DISLab/SummLlama3.2-3B
任务类型	文本摘要
标签	TensorBlock、GGUF

项目名称	项目介绍	项目图片	项目链接
Awesome MCP Servers	一个全面的模型上下文协议（MCP）服务器集合。		查看项目
TensorBlock Studio	一个轻量级、开放且可扩展的多大语言模型交互工作室。		查看项目

提示模板

<|begin_of_text|><|start_header_id|>system<|end_header_id|>

知识截止日期：2023年12月
当前日期：2024年11月20日

{system_prompt}<|eot_id|><|start_header_id|>user<|end_header_id|>

{prompt}<|eot_id|><|start_header_id|>assistant<|end_header_id|>

模型文件规格

文件名	量化类型	文件大小	描述
SummLlama3.2-3B-Q2_K.gguf	Q2_K	1.364 GB	最小，但质量损失显著，大多数情况下不推荐使用
SummLlama3.2-3B-Q3_K_S.gguf	Q3_K_S	1.543 GB	非常小，但质量损失高
SummLlama3.2-3B-Q3_K_M.gguf	Q3_K_M	1.687 GB	非常小，但质量损失高
SummLlama3.2-3B-Q3_K_L.gguf	Q3_K_L	1.815 GB	小，质量损失较大
SummLlama3.2-3B-Q4_0.gguf	Q4_0	1.917 GB	旧版本；小，质量损失非常高，建议使用 Q3_K_M
SummLlama3.2-3B-Q4_K_S.gguf	Q4_K_S	1.928 GB	小，质量损失更大
SummLlama3.2-3B-Q4_K_M.gguf	Q4_K_M	2.019 GB	中等，质量平衡，推荐使用
SummLlama3.2-3B-Q5_0.gguf	Q5_0	2.270 GB	旧版本；中等，质量平衡，建议使用 Q4_K_M
SummLlama3.2-3B-Q5_K_S.gguf	Q5_K_S	2.270 GB	大，质量损失低，推荐使用
SummLlama3.2-3B-Q5_K_M.gguf	Q5_K_M	2.322 GB	大，质量损失非常低，推荐使用
SummLlama3.2-3B-Q6_K.gguf	Q6_K	2.644 GB	非常大，质量损失极低
SummLlama3.2-3B-Q8_0.gguf	Q8_0	3.422 GB	非常大，质量损失极低，不推荐使用

📦 安装指南

命令行下载

首先，安装 Huggingface 客户端：

pip install -U "huggingface_hub[cli]"

然后，将单个模型文件下载到本地目录：

huggingface-cli download tensorblock/SummLlama3.2-3B-GGUF --include "SummLlama3.2-3B-Q2_K.gguf" --local-dir MY_LOCAL_DIR

如果你想按模式（例如 *Q4_K*gguf）下载多个模型文件，可以尝试：

huggingface-cli download tensorblock/SummLlama3.2-3B-GGUF --local-dir MY_LOCAL_DIR --local-dir-use-symlinks False --include='*Q4_K*gguf'

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

智启未来，您的人工智能解决方案智库