Open Cabrita 3B开源大语言模型 - 优化葡萄牙语，缩小外语与英语模型差距

首页

Open Cabrita3b GGUF

由 lucianosb 开发

Open Cabrita 3B 是一个针对葡萄牙语优化的开源大语言模型，基于LLaMA架构，旨在缩小外语与英语模型之间的性能差距。

大型语言模型其他开源协议:Apache-2.0 #葡萄牙语模型 #小参数高效 #文本生成

下载量 352

发布时间 : 8/27/2023

模型简介

该模型专门为葡萄牙语设计，通过优化训练填补了非英语语言的模型性能缺口，支持文本生成等任务。

模型特点

葡萄牙语优化

专门针对葡萄牙语进行训练和优化，显著提升葡萄牙语文本生成质量。

开源许可

采用Apache 2.0许可证，允许商业和研究用途。

轻量化设计

3B参数规模在保持性能的同时降低资源需求。

模型能力

葡萄牙语文本生成

指令跟随

对话系统

使用案例

内容创作

葡萄牙语文章写作

帮助用户生成葡萄牙语文章、博客等内容。

生成流畅、符合语境的葡萄牙语文本

教育

语言学习辅助

为葡萄牙语学习者提供写作辅助和语言练习。

生成适合不同学习阶段的葡萄牙语材料

🚀 Open Cabrita 3B - GGUF

Open Cabrita 3B - GGUF 是基于 Open Cabrita 3B 模型量化后的版本，提供了多种量化文件，适用于不同的使用场景，能在 llama.cpp 等工具中运行。

🚀 快速开始

你可以使用以下命令在 llama.cpp 中运行该模型：

./main -m ./models/open-cabrita3b/opencabrita3b-q5_1.gguf --color --temp 0.5 -n 256 -p "### Instrução: {comando} ### Resposta: "

若要理解参数含义，请查看 llama.cpp 文档。

你还可以在 Google Colab 上免费体验：Open_Cabrita_llamacpp_5_1.ipynb

✨ 主要特性

提供多种量化文件，可根据需求选择不同的量化方法和比特数，以平衡精度和资源使用。
采用新的 GGUF 格式，该格式是可扩展且面向未来的，能存储更多模型元信息，还包含显著改进的分词代码。
支持多种客户端和库，方便在不同环境中使用。

📦 安装指南

文档未提供具体安装步骤，可参考各支持的客户端和库的官方文档进行安装，如 llama.cpp、text-generation-webui 等。

💻 使用示例

基础用法

./main -m ./models/open-cabrita3b/opencabrita3b-q5_1.gguf --color --temp 0.5 -n 256 -p "### Instrução: {comando} ### Resposta: "

高级用法

可根据 llama.cpp 文档调整命令中的参数，以满足不同的使用需求。

📚 详细文档

模型信息

模型创建者：22h
原始模型：Open Cabrita 3B
论文：CABRITA: CLOSING THE GAP FOR FOREIGN LANGUAGES

包含文件

名称	量化方法	比特数	大小	描述
opencabrita3b-q4_0.gguf	q4_0	4	1.94 GB	4 位量化。
opencabrita3b-q4_1.gguf	q4_1	4	2.14 GB	4 位量化。精度高于 q4_0，但不如 q5_0。推理速度比 q5 模型快。
opencabrita3b-q5_0.gguf	q5_0	5	2.34 GB	5 位量化。精度更高，资源使用更多，推理速度更慢。
opencabrita3b-q5_1.gguf	q5_1	5	2.53 GB	5 位量化。精度更高，资源使用更多，推理速度更慢。
opencabrita3b-q8_0.gguf	q8_0	8	3.52 GB	8 位量化。几乎与 float16 无区别。使用大量资源且速度更慢。

注意：上述 RAM 值未考虑 GPU 卸载。如果将层卸载到 GPU，将减少 RAM 使用并使用 VRAM。

关于 GGUF 格式

GGUF 是 llama.cpp 团队在 2023 年 8 月 21 日引入的新格式，它是 GGML 的替代品，后者已不再被 llama.cpp 支持。

GGUF 的主要优点是它是一个可扩展且面向未来的格式，能将更多关于模型的信息作为元数据存储。它还包含显著改进的分词代码，首次实现了对特殊标记的完全支持。这有望提高性能，特别是对于使用新特殊标记并实现自定义提示模型的模型。

以下是已知支持 GGUF 的客户端和库列表：

llama.cpp。
text-generation-webui，最广泛使用的 Web 界面。通过 ctransformers 后端支持 GPU 加速的 GGUF - llama-cpp-python 后端也即将支持。
KoboldCpp，从 1.41 版本开始支持 GGUF！一个强大的 GGML Web 界面，具有全 GPU 加速。特别适合讲故事。
LM Studio，0.2.2 及更高版本支持 GGUF。一个功能齐全的本地 GUI，在 Windows（NVIDIA 和 AMD）和 macOS 上都支持 GPU 加速。
LoLLMS Web UI，现在应该可以使用，选择 c_transformers 后端。一个很棒的 Web 界面，有很多有趣的功能。支持 CUDA GPU 加速。
ctransformers，从 0.2.24 版本开始支持 GGUF！一个支持 GPU 加速、LangChain 和兼容 OpenAI 的 AI 服务器的 Python 库。
llama-cpp-python，从 0.1.79 版本开始支持 GGUF。一个支持 GPU 加速、LangChain 和兼容 OpenAI 的 API 服务器的 Python 库。
candle，8 月 22 日添加了对 GGUF 的支持。Candle 是一个注重性能的 Rust ML 框架，包括 GPU 支持和易用性。
LocalAI，8 月 23 日添加了对 GGUF 的支持。LocalAI 为大语言模型和图像生成模型提供 REST API。

模板

### Instrução:
{prompt}

### Resposta:

🔧 技术细节

GGUF 格式是 llama.cpp 团队在 2023 年 8 月 21 日引入的新格式，它是可扩展且面向未来的，能存储更多模型元信息。其包含显著改进的分词代码，首次实现了对特殊标记的完全支持，这有助于提高使用新特殊标记和自定义提示模型的性能。

📄 许可证

本项目采用 Apache-2.0 许可证。

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

智启未来，您的人工智能解决方案智库