Huihui-gemma-3n-E4B-it-abliterated-Q4_K_M-GGUF开源模型

首页

Huihui Gemma 3n E4B It Abliterated Q4 K M GGUF

由 Triangle104 开发

这是一个基于huihui-ai/Huihui-gemma-3n-E4B-it-abliterated模型转换的GGUF格式模型，适用于文本生成任务。

大型语言模型

Transformers

#多模态文本生成 #高效量化推理 #消融优化模型

下载量 143

发布时间 : 7/10/2025

模型简介

该模型是从原始模型转换而来的GGUF格式版本，主要用于文本生成任务，支持多种文本处理能力。

模型特点

GGUF格式

模型已转换为GGUF格式，便于在llama.cpp等工具中使用。

文本生成

支持高质量的文本生成任务。

模型能力

文本生成

自动语音识别

自动语音翻译

音频文本转文本

视频文本转文本

使用案例

文本处理

文本生成

生成连贯的文本内容。

🚀 Triangle104/Huihui-gemma-3n-E4B-it-abliterated-Q4_K_M-GGUF

本项目将模型从 huihui-ai/Huihui-gemma-3n-E4B-it-abliterated 转换为 GGUF 格式。转换借助 llama.cpp 并通过 ggml.ai 的 GGUF-my-repo 空间完成。如需了解该模型的更多详细信息，请参考原始模型卡片。

🚀 快速开始

访问 Gemma 模型

要在 Hugging Face 上访问 Gemma 模型，你需要查看并同意 Google 的使用许可。请确保你已登录 Hugging Face 账号，然后点击下方按钮。请求将立即处理。

按钮内容：确认许可

模型基本信息

属性	详情
库名称	transformers
任务类型	图像文本转文本
基础模型	huihui-ai/Huihui-gemma-3n-E4B-it-abliterated
标签	自动语音识别、自动语音翻译、音频文本转文本、视频文本转文本、消融处理、未审查、llama-cpp、gguf-my-repo
许可证	gemma

📦 安装指南

使用 Homebrew 安装 llama.cpp（适用于 Mac 和 Linux）

brew install llama.cpp

💻 使用示例

基础用法

使用 CLI 进行推理

llama-cli --hf-repo Triangle104/Huihui-gemma-3n-E4B-it-abliterated-Q4_K_M-GGUF --hf-file huihui-gemma-3n-e4b-it-abliterated-q4_k_m.gguf -p "The meaning to life and the universe is"

使用 Server 进行推理

llama-server --hf-repo Triangle104/Huihui-gemma-3n-E4B-it-abliterated-Q4_K_M-GGUF --hf-file huihui-gemma-3n-e4b-it-abliterated-q4_k_m.gguf -c 2048

高级用法

你也可以按照 Llama.cpp 仓库中列出的使用步骤直接使用此检查点。

步骤 1：从 GitHub 克隆 llama.cpp

git clone https://github.com/ggerganov/llama.cpp

步骤 2：进入 llama.cpp 文件夹并使用 `LLAMA_CURL=1` 标志以及其他特定于硬件的标志（例如，在 Linux 上使用 Nvidia GPU 时使用 `LLAMA_CUDA=1`）进行编译

cd llama.cpp && LLAMA_CURL=1 make

步骤 3：通过主二进制文件运行推理

./llama-cli --hf-repo Triangle104/Huihui-gemma-3n-E4B-it-abliterated-Q4_K_M-GGUF --hf-file huihui-gemma-3n-e4b-it-abliterated-q4_k_m.gguf -p "The meaning to life and the universe is"

或者

./llama-server --hf-repo Triangle104/Huihui-gemma-3n-E4B-it-abliterated-Q4_K_M-GGUF --hf-file huihui-gemma-3n-e4b-it-abliterated-q4_k_m.gguf -c 2048

📄 许可证

本模型使用的许可证为 gemma。

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

智启未来，您的人工智能解决方案智库

Huihui Gemma 3n E4B It Abliterated Q4 K M GGUF

模型简介

模型特点

模型能力

使用案例

🚀 Triangle104/Huihui-gemma-3n-E4B-it-abliterated-Q4_K_M-GGUF

🚀 快速开始

访问 Gemma 模型

模型基本信息

📦 安装指南

使用 Homebrew 安装 llama.cpp（适用于 Mac 和 Linux）

💻 使用示例

基础用法

使用 CLI 进行推理

使用 Server 进行推理

高级用法

步骤 1：从 GitHub 克隆 llama.cpp

步骤 2：进入 llama.cpp 文件夹并使用 LLAMA_CURL=1 标志以及其他特定于硬件的标志（例如，在 Linux 上使用 Nvidia GPU 时使用 LLAMA_CUDA=1）进行编译

步骤 3：通过主二进制文件运行推理

📄 许可证

步骤 2：进入 llama.cpp 文件夹并使用 `LLAMA_CURL=1` 标志以及其他特定于硬件的标志（例如，在 Linux 上使用 Nvidia GPU 时使用 `LLAMA_CUDA=1`）进行编译