Taiwan-LLM-13B-v2.0-chat-GGUF開源大語言模型 - 支持繁體中文，免費部署！

Taiwan LLM 13B V2.0 Chat GGUF

由audreyt開發

基於LLaMa2-13b的臺灣大語言模型，支持繁體中文，採用GGUF格式

下載量 80

發布時間 : 11/9/2023

模型概述

這是一個基於LLaMa2-13b架構的大語言模型，專門針對繁體中文進行了優化，支持文本生成任務。模型採用GGUF格式，便於在各種客戶端和庫中使用。

繁體中文優化

在200億繁體中文token上繼續預訓練，特別適合臺灣地區使用

GGUF格式支持

採用新一代GGUF格式，具有更好的擴展性和前瞻性，支持更多客戶端和庫

指令微調

在數百萬對話數據上進行指令微調，提供更好的對話體驗

中文文本生成

對話系統

推薦信撰寫

對話系統

智能客服

用於構建中文智能客服系統

提供有用、詳細且禮貌的回答

文本生成

推薦信撰寫

幫助用戶生成推薦信

Taiwan-LLM-13B-v2.0-chat-GGUF 是基於 LLaMa2-13b 的臺灣大語言模型的 GGUF 格式模型文件，可用於文本生成。使用該模型需明確歸功於優必達株式會社 Ubitus 以及原始作者。

GGUF 是 llama.cpp 團隊在 2023 年 8 月 21 日引入的一種新格式，它替代了不再受 llama.cpp 支持的 GGML 格式。

GGUF 的主要優點在於它是一種可擴展、面向未來的格式，能將更多關於模型的信息作為元數據存儲。此外，它還顯著改進了分詞代碼，首次實現了對特殊標記的全面支持，這有望提升性能，尤其是對於使用新特殊標記和自定義提示模板的模型。

截至 8 月 25 日，已知支持 GGUF 的客戶端和庫如下：

llama.cpp
text - generation - webui，這是最廣泛使用的 Web UI，通過 ctransformers 後端支持 GGUF 並實現 GPU 加速，llama - cpp - python 後端也即將支持。
KoboldCpp，從版本 1.41 開始支持 GGUF，這是一個強大的 GGML Web UI，具備完整的 GPU 加速功能，尤其適合用於講故事。
LM Studio，0.2.2 及更高版本支持 GGUF，這是一個功能齊全的本地 GUI，在 Windows（NVIDIA 和 AMD）和 macOS 上均支持 GPU 加速。
LoLLMS Web UI，現在應該可以使用，選擇 c_transformers 後端，這是一個擁有許多有趣功能的出色 Web UI，支持 CUDA GPU 加速。
ctransformers，從 0.2.24 版本開始支持 GGUF，這是一個支持 GPU 加速、LangChain 以及兼容 OpenAI 的 AI 服務器的 Python 庫。
llama - cpp - python，從 0.1.79 版本開始支持 GGUF，這是一個支持 GPU 加速、LangChain 以及兼容 OpenAI 的 API 服務器的 Python 庫。
candle，於 8 月 22 日添加了對 GGUF 的支持，Candle 是一個 Rust ML 框架，注重性能（包括 GPU 支持）和易用性。