Taiwan-LLM-13B-v2.0-chat-GGUF开源大语言模型 - 支持繁体中文，免费部署！

Taiwan LLM 13B V2.0 Chat GGUF

由 audreyt 开发

基于LLaMa2-13b的台湾大语言模型，支持繁体中文，采用GGUF格式

下载量 80

发布时间 : 11/9/2023

模型简介

这是一个基于LLaMa2-13b架构的大语言模型，专门针对繁体中文进行了优化，支持文本生成任务。模型采用GGUF格式，便于在各种客户端和库中使用。

繁体中文优化

在200亿繁体中文token上继续预训练，特别适合台湾地区使用

GGUF格式支持

采用新一代GGUF格式，具有更好的扩展性和前瞻性，支持更多客户端和库

指令微调

在数百万对话数据上进行指令微调，提供更好的对话体验

中文文本生成

对话系统

推荐信撰写

对话系统

智能客服

用于构建中文智能客服系统

提供有用、详细且礼貌的回答

文本生成

推荐信撰写

帮助用户生成推荐信

Taiwan-LLM-13B-v2.0-chat-GGUF 是基于 LLaMa2-13b 的台湾大语言模型的 GGUF 格式模型文件，可用于文本生成。使用该模型需明确归功于优必达株式会社 Ubitus 以及原始作者。

GGUF 是 llama.cpp 团队在 2023 年 8 月 21 日引入的一种新格式，它替代了不再受 llama.cpp 支持的 GGML 格式。

GGUF 的主要优点在于它是一种可扩展、面向未来的格式，能将更多关于模型的信息作为元数据存储。此外，它还显著改进了分词代码，首次实现了对特殊标记的全面支持，这有望提升性能，尤其是对于使用新特殊标记和自定义提示模板的模型。

截至 8 月 25 日，已知支持 GGUF 的客户端和库如下：

llama.cpp
text - generation - webui，这是最广泛使用的 Web UI，通过 ctransformers 后端支持 GGUF 并实现 GPU 加速，llama - cpp - python 后端也即将支持。
KoboldCpp，从版本 1.41 开始支持 GGUF，这是一个强大的 GGML Web UI，具备完整的 GPU 加速功能，尤其适合用于讲故事。
LM Studio，0.2.2 及更高版本支持 GGUF，这是一个功能齐全的本地 GUI，在 Windows（NVIDIA 和 AMD）和 macOS 上均支持 GPU 加速。
LoLLMS Web UI，现在应该可以使用，选择 c_transformers 后端，这是一个拥有许多有趣功能的出色 Web UI，支持 CUDA GPU 加速。
ctransformers，从 0.2.24 版本开始支持 GGUF，这是一个支持 GPU 加速、LangChain 以及兼容 OpenAI 的 AI 服务器的 Python 库。
llama - cpp - python，从 0.1.79 版本开始支持 GGUF，这是一个支持 GPU 加速、LangChain 以及兼容 OpenAI 的 API 服务器的 Python 库。
candle，于 8 月 22 日添加了对 GGUF 的支持，Candle 是一个 Rust ML 框架，注重性能（包括 GPU 支持）和易用性。