Typhoon2.1-Gemma3-12B开源泰语大语言模型 - 长上下文支持函数调用强指令处理

首页

Typhoon2.1 Gemma3 12b Gguf

由 scb10x 开发

Typhoon2.1-Gemma3-12B 是一个指令型泰语大语言模型，拥有 120 亿参数、128K 的上下文长度以及函数调用能力。

大型语言模型 #泰语大模型 #128K长文本处理 #函数调用能力

下载量 186

发布时间 : 5/5/2025

模型简介

基于 Gemma3 12B 构建的泰语大语言模型，专注于文本生成任务，支持长上下文处理和函数调用。

模型特点

大参数规模

拥有 120 亿参数，具备强大的语言理解和生成能力。

长上下文支持

支持 128K 的上下文长度，能够处理更长的文本输入。

函数调用能力

具备函数调用能力，可实现更复杂的交互。

量化版本

提供 gguf q4_k_m 量化版本，便于在资源有限的环境中部署。

模型能力

泰语文本生成

长文本处理

函数调用

指令跟随

使用案例

自然语言处理

泰语文本生成

生成高质量的泰语文本内容。

长文档处理

处理和分析长篇幅的泰语文档。

🚀 Typhoon2.1-Gemma3-12B

Typhoon2.1-Gemma3-12B 是一个指令型泰语大语言模型，拥有 120 亿参数、128K 的上下文长度以及函数调用能力。它基于 Gemma3 12B 构建。本仓库包含原始 Typhoon2.1 12B 的 gguf q4_k_m 量化版本。

需注意，这是一个仅处理文本的模型。

🚀 快速开始

与 llama.cpp 结合使用

可以通过 brew（适用于 Mac 和 Linux）安装 llama.cpp：

brew install llama.cpp

之后可以调用 llama.cpp 服务器或命令行界面（CLI）。

CLI 使用方式

llama-cli --hf-repo scb10x/typhoon2.1-gemma3-12b-gguf --hf-file typhoon2.1-gemma3-12b-q4_k_m.gguf -p "The meaning to life and the universe is"

服务器使用方式

llama-server --hf-repo scb10x/typhoon2.1-gemma3-12b-gguf --hf-file typhoon2.1-gemma3-12b-q4_k_m.gguf -c 2048

此外，你也可以直接按照 Llama.cpp 仓库中列出的使用步骤来使用此检查点：

从 GitHub 克隆 llama.cpp：

git clone https://github.com/ggerganov/llama.cpp

进入 llama.cpp 文件夹，并使用 LLAMA_CURL=1 标志以及其他特定硬件标志（例如，在 Linux 上使用英伟达 GPU 时设置 LLAMA_CUDA=1）进行编译：

cd llama.cpp && LLAMA_CURL=1 make

通过主二进制文件运行推理：

./llama-cli --hf-repo scb10x/typhoon2.1-gemma3-12b-gguf --hf-file typhoon2.1-gemma3-12b-q4_k_m.gguf -p "The meaning to life and the universe is"

或者

./llama-server --hf-repo scb10x/typhoon2.1-gemma3-12b-gguf --hf-file typhoon2.1-gemma3-12b-q4_k_m.gguf -c 2048

✨ 主要特性

参数规模：拥有 120 亿参数，具备强大的语言理解和生成能力。
上下文长度：支持 128K 的上下文长度，能够处理更长的文本输入。
函数调用：具备函数调用能力，可实现更复杂的交互。

📦 安装指南

通过 brew 安装 llama.cpp：

brew install llama.cpp

💻 使用示例

基础用法

使用 CLI 进行推理：

llama-cli --hf-repo scb10x/typhoon2.1-gemma3-12b-gguf --hf-file typhoon2.1-gemma3-12b-q4_k_m.gguf -p "The meaning to life and the universe is"

高级用法

使用服务器模式进行推理：

llama-server --hf-repo scb10x/typhoon2.1-gemma3-12b-gguf --hf-file typhoon2.1-gemma3-12b-q4_k_m.gguf -c 2048

📚 详细文档

性能表现

12b 模型性能

📄 许可证

本模型使用 gemma 许可证。

📋 模型信息

属性	详情
基础模型	scb10x/typhoon2.1-gemma3-12b
许可证	gemma
任务类型	文本生成
标签	llama-cpp

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

智启未来，您的人工智能解决方案智库