AfroLlama_V1开源语言模型 - 免费处理斯瓦希里等多语言文本并生成内容

首页

Afrollama V1

由 Jacaranda 开发

AfroLlama3是基于Meta-Llama-3-8B优化的80亿参数语言模型，专门针对斯瓦希里语、英语、祖鲁语、科萨语、约鲁巴语和豪萨语的文本处理与生成进行优化。

大型语言模型

Transformers

支持多种语言#非洲多语言优化 #文化敏感生成 #LoRA融合架构

下载量 122

发布时间 : 7/11/2024

模型简介

该模型旨在提升六种目标语言用户的自然语言理解和生成能力，同时保留原版Llama 3的通用语言能力。

模型特点

多语言优化

专门针对六种非洲语言进行优化，提升文本理解和生成能力。

三阶段训练

采用基于LoRA的单语言预训练、模型融合和指令微调的三阶段训练过程。

文化敏感性

强调文化敏感性理解，融入安全数据集减少偏见。

保留通用能力

在优化特定语言能力的同时，保留原版Llama 3的通用语言能力。

模型能力

多语言文本生成

特定领域问答

文化敏感内容理解

指令跟随

使用案例

行业应用

医疗问答系统

为非洲地区提供多语言的医疗信息问答服务。

教育助手

支持多语言的教育内容生成和问答。

文化内容创作

多语言故事生成

生成包含文化元素的寓言和故事。

相比原版模型能生成更符合文化背景的内容

🚀 AfroLlama3

AfroLlama3是一个专注于处理和生成斯瓦希里语、科萨语、祖鲁语、约鲁巴语、豪萨语和英语文本的语言模型。它基于Meta-Llama-3-8B构建，经过特定的训练和优化，在这些语言的任务上表现出色，能为相关用户和研究者提供强大的自然语言处理能力。

🚀 快速开始

你可以使用这个笔记本进行推理。我们建议在L4或A100 GPU上进行推理。

✨ 主要特性

多语言优化：在斯瓦希里语、科萨语、祖鲁语、约鲁巴语、豪萨语和英语任务上有显著提升的性能。
通用语言能力：保留了原始Llama 3模型的通用语言处理能力。
针对性优化：针对理解和生成斯瓦希里语、科萨语、祖鲁语、约鲁巴语、豪萨语和英语文本进行了优化。

📦 安装指南

文档未提及安装步骤，故跳过此章节。

📚 详细文档

模型详情

AfroLlama3是一个拥有80亿参数的语言模型，它建立在meta-llama/Meta-Llama-3-8B的基础上。该模型经过特别增强，能够出色地处理和生成斯瓦希里语、科萨语、祖鲁语、约鲁巴语、豪萨语和英语文本，旨在提升使用这些语言的用户和研究者的自然语言理解和生成能力。

模型描述

关键特性

在斯瓦希里语、科萨语、祖鲁语、约鲁巴语、豪萨语和英语任务上有更好的性能表现。
保留了原始Llama 3模型的通用语言能力。
针对理解和生成斯瓦希里语、科萨语、祖鲁语、约鲁巴语、豪萨语和英语文本进行了优化。

训练过程

AfroLlama的训练过程主要分为三个阶段：

基于LoRA的各语言持续预训练：使用公开可用的各语言语料库进行持续预训练，主要关注因果语言建模，即训练模型根据前文预测下一个标记。在此过程中，我们采用了LoRA技术，冻结了基础Meta/Llama3模型的参数，并引入了额外的轻量级组件（适配器）。这些适配器专门用于捕捉每种语言的特点、术语和细微差别，且在不同语言中保持相同的LoRA超参数。
合并：使用基于Ties（修剪、选择和符号）的合并方法，将特定语言的预训练检查点合并为一个独立的模型。Ties方法包括三个步骤：
- 重置微调中变化不显著的参数（修剪）：识别在持续预训练过程中变化不大的参数，并将其重置为原始值，以减少过拟合并提高泛化能力。
- 解决符号冲突（干扰）：处理不同训练示例或目标导致参数符号更新冲突的情况，避免干扰或降低模型性能。
- 仅合并与最终商定符号一致的参数：仅合并或更新那些符号与共识方向（多数符号）一致的参数，有助于减少噪声并提高模型的整体一致性。
基于LoRA的指令微调：
- 在精心策划的斯瓦希里语、科萨语、祖鲁语、约鲁巴语、豪萨语和英语指令及响应数据集上对合并后的模型进行微调。
- 包含特定任务数据，以提高在常见语言任务上的性能。
- 强调在斯瓦希里语、科萨语、祖鲁语、约鲁巴语、豪萨语和英语中保持连贯性和上下文理解。
- 纳入安全数据集，提高模型生成安全和符合道德规范响应的能力。
- 包含有害内容示例和适当的非有害替代方案。
- 专注于减少偏差，提高模型在斯瓦希里语、科萨语、祖鲁语、约鲁巴语、豪萨语和英语语境中对文化敏感性的理解。

指令微调数据集规模：约[331,400个指令 - 响应对]

模型信息

属性	详情
开发者	Jacaranda Health
模型类型	Llama
支持语言 (NLP)	斯瓦希里语、科萨语、祖鲁语、约鲁巴语、豪萨语和英语
许可证	CC BY - NC - SA 4.0 DEED
模型开发者	Stanslaus Mwongela, Jay Patel, Sathy Rajasekharan, Lyvia Lusiji, Francesco Piccino, Mfoniso Ukwak, Ellen Sebastian

应用场景

AfroLlama针对下游任务进行了优化，尤其适用于需要斯瓦希里语、科萨语、祖鲁语、约鲁巴语、豪萨语和英语指令数据集的任务。组织可以根据特定领域进一步微调该模型，潜在应用领域包括：

特定领域的问答：为特定领域的问题提供准确的答案。
智能助手聊天功能：在医疗保健、农业、法律、教育、旅游和酒店、公共服务、金融、通信、客户服务、商业等领域提供智能对话服务。

样本评估提示

提示	AfroLlama响应	Meta - Llama - 3 - 8B - Instruct响应
斯瓦希里语：Andika hadithi ya bwana sungura (翻译：写一个关于兔子先生的故事)	从前，有一只聪明的兔子，名叫兔子先生。他是森林里最聪明的生物，以其明智的建议和智慧而闻名。兔子在森林里生活了很多年，对周围的世界了解很多。每天，他都会花时间探索森林，结识不同的生物，并学习新的信息。兔子先生和他遇到的每个人都很友好。如果有人需要建议或指导，他们会去找兔子先生。他也很慷慨和乐于助人，会提供明智而有见地的建议。兔子先生也是森林的伟大守护者。他保护树木和植物免受伤害，确保没有人在他不知情的情况下经过他的领地。兔子先生深受许多人的喜爱，他的遗产将通过代代相传的故事延续下去。	写一个关于兔子先生的故事！
约鲁巴语：Kọ itan nipa Ọgbọn Ehoroa (翻译：讲述兔子先生的故事)	从前，有一只充满冒险精神的野兔。他总是想了解他小村庄以外的世界和他能看到的奇迹。有一天，他决定开始一次伟大的旅程。他去了遥远的地方，看到了许多奇迹，如山、河流和森林。他甚至遇到了像龙和神奇动物这样的神秘生物。经过漫长的旅程，他回到了他的小村庄，快乐而感激地生活着，为他所看到的一切。	我认为你是让我讲一个关于Ogbọn Ehoroa的故事。这是一个简短的故事：Ogbọn Ehoroa是一位聪明善良的女士，她住在一个被郁郁葱葱的绿色森林和连绵起伏的山丘环绕的小村庄里。她以其出色的烹饪技巧而闻名，尤其是她美味的棕榈酒汤。有一天，一场严重的干旱袭击了这片土地，村民们难以找到食物和水。庄稼枯萎了，河流干涸了。村民们很担心，不知道该怎么办。Ogbọn Ehoroa召集了村里的长老们开会，并提出了一个解决方案。她建议他们一起建造一个新的灌溉系统，把附近小溪的水引到干涸的田地。村民们一开始很怀疑，但Ogbọn Ehoroa的坚持和决心最终说服了他们。他们不知疲倦地工作了几天，挖掘沟渠和建造运河。令每个人惊讶的是，这个计划成功了！庄稼又开始生长了，村民们有了足够的食物。作为感激之情的象征，村民们决定庆祝Ogbọn Ehoroa的勇敢和智慧。他们准备了一场盛大的宴会，还有她著名的棕榈酒汤。从那天起，Ogbọn Ehoroa被誉为英雄，成为希望和坚韧的象征。你觉得呢？你想让我继续这个故事还是开始一个新的故事？
豪萨语：Rubuta labarin Mista Zomo (翻译：写一个关于兔子先生的故事)	从前，有一只名叫兔子先生的兔子，他住在一所大房子里。他非常快乐，喜欢玩耍，但他经常感到孤独，因为没有人可以和他一起分享游戏。有一天，他决定出去找朋友。他去了不同的地方，直到遇到了一只名叫黛西的兔子。兔子先生和黛西立刻成了朋友，他们一起度过了剩下的一天。从那天起，兔子先生再也没有感到孤独——他总是有一个朋友可以分享他的快乐。	我明白你在问豪萨语短语“Rubuta labarin Mista Zomo”。“Rubuta”的意思是“写”，“labari”的意思是“故事”或“新闻”，“Mista Zomo”可能是一个专有名词，可能是一个头衔或名字。所以，这个短语的一个可能的翻译是“写兔子先生的故事”或“写兔子先生的新闻”。你能提供更多关于你想用这个短语实现什么目标的背景信息或信息吗？我很乐意进一步帮助你！
科萨语：Bhala ibali ngoMnumzana Mqhagi (翻译：讲述Mqhagi先生的故事)	很久以前，有一个名叫Scrooge先生的人，他对任何事情都完全不感兴趣。他对钱有极大的兴趣，并决心保住他所有的财富。他总是在寻找省钱的方法，即使这意味着削减小开支或把他的钱存在一个永远不会动用的银行里。有一天，Scrooge先生发现他有数百美元的贵重物品和其他珍贵的东西。他满心欢喜，决定用这笔钱进行有益的投资。他建立了一个成功的企业，变得富有起来。Scrooge先生成了一个富有的人，对他的新生活感到满足。但随着时间的推移，Scrooge先生意识到他的财富从未真正让他满足。他想要拥有更多的钱，但没有人能帮助他找到更多。最终，他通过拥有更多的钱找到了满足感，但他发现这并没有那么重要。Scrooge先生学到了财富并不能带来真正的幸福。他所获得的一切只是有用的东西，并没有什么更重要的。	看起来你在说祖鲁语！“Bhala ibali ngoMnumzana Mqhagi”大致翻译为“讲个故事，长老Mqhagi”。在传统的祖鲁文化中，“Mnumzana”是一位受人尊敬的长者或智者，他通过自己的经历获得了知识和智慧。短语“Bhala ibali”的意思是“讲个故事”，它通常用于要求某人与他人分享他们的经历、智慧或教诲。所以，在这种情况下，你是在要求长老Mqhagi分享一个故事或传授他的智慧！
祖鲁语：Bhala indaba yoMnumzane Unogwaja (翻译：写一个关于兔子先生的故事)	从前，有一只名叫兔子先生的兔子。他是一个渺小而谦逊的生物，但有着强烈的冒险精神和好奇心。有一天，他决定开始他的第一次旅程。他穿过一片广阔的绿色森林，一路上和其他动物交朋友。他渡过一条汹涌的河流，穿过一片黑暗而可怕的森林，并凝视着夜空中的星星。最后，兔子先生来到了一个小村庄。他对他遇到的友好善良的人们感到惊讶。他享受着他们做的美味食物和甜点。兔子先生在那里住了很长时间，最终成为了村里其他动物的朋友。他从他们那里学到了很多，最后带着对生活的新感激和对他人的善意回到了家。	这是一个传统的祖鲁语短语！“Bhala indaba yoMnumzane Unogwaja”大致翻译为：“讲述Unogwaja先生的事情”。在祖鲁文化中，“indaba”的意思是“事情”或“新闻”，“yoMnumzane”是一种尊敬地称呼某人的方式，使用头衔“Mnumzane”，意思是“先生”或“领主”。所以，这个短语本质上是说“告诉我关于Unogwaja先生的新闻”。Unogwaja是一位传奇的祖鲁战士和酋长，他在盎格鲁 - 祖鲁战争中发挥了重要作用。这个短语可能是用来指与他的生活或行为相关的特定故事或新闻。你想了解更多关于Unogwaja或祖鲁文化的信息吗？
英语：Write a story about Mr.Hare	从前，有一只调皮的兔子，名叫野兔先生，他住在森林里的一个小洞穴里。他非常爱冒险，喜欢探索，但他总是小心翼翼，以免被抓住。有一天，在探索时，他偶然发现了一座从未有人见过的巨大城堡。他决定走近看看，很快就发现自己置身于一个宏伟的大厅里。他探索了整个城堡，直到偶然发现了一个藏有魔法宝石的秘密房间。他迅速拿起宝石就跑了，再也没有回头。从那时起，野兔先生过着冒险的生活，用他新发现的魔法帮助他探索世界。	从前，在两棵巨大的橡树之间的一片阳光明媚的草地上，住着一只聪明而机智的兔子，名叫野兔先生。他是一个温柔的灵魂，眼睛里闪烁着光芒，脚步轻快。野兔先生每天都躺在温暖的草地上，嚼着多汁的三叶草，看着世界流逝。他最喜欢的就是坐下来观察草地上其他生物的滑稽动作。有一天，当他懒洋洋地嚼着一片特别多汁的三叶草时，他看到一群吵闹的田鼠四处乱窜，互相追逐，高兴地吱吱叫着。野兔先生暗自笑了笑，想起自己曾经也像那些小老鼠一样无忧无虑、精力充沛。当他坐在那里陷入沉思时，一只小鹿走进了草地，她大大的棕色眼睛打量着这个热闹社区的景象和声音。她看到了野兔先生，小跑着过来打招呼。“你好啊，小家伙！”野兔先生叫道，他的长耳朵兴奋地竖了起来。“是什么风把你吹到我们这片地方来了？”小鹿解释说她是新来这片草地的，正在找朋友一起玩。野兔先生的脸上露出了温暖的笑容。“啊，嗯，你找对地方了！我知道有一群捣蛋鬼会很乐意和你一起玩的。”野兔先生甩了甩他毛茸茸的尾巴，带着小鹿在草地上开始了一场疯狂的冒险。他们追逐蝴蝶，在高高的草丛后面玩捉迷藏，甚至偶然发现了一片隐藏的甜美成熟的浆果。当太阳开始落山，金色的光芒洒在草地上时，野兔先生在小鹿旁边坐了下来，感到满足和充满喜悦。

非预期使用场景

开发的大语言模型（LLM）能力仅用于研究、社会公益和内部使用目的。对于商业使用和分发，建议组织/个人联系Jacaranda Health。为确保AfroLlama的道德和负责任使用，我们制定了一套指南，将活动和实践分为三个主要类别：禁止行为、高风险活动和欺骗性做法。用户通过理解和遵守这些指令，可以为更安全、更值得信赖的环境做出贡献。

禁止行为：
- 非法活动：避免宣传暴力、儿童剥削、人口贩卖和其他犯罪行为。
- 骚扰和歧视：不得进行欺凌、威胁或歧视行为。
- 未经授权的职业活动：不得从事无执照的专业活动。
- 数据滥用：在处理个人数据时需获得适当的同意。
- 侵犯权利：尊重第三方权利。
- 恶意软件创建：避免创建有害软件。
高风险活动：
- 危险行业：不得在军事、核或间谍领域使用。
- 武器和毒品：避免参与非法武器或毒品活动。
- 关键系统：不得在关键基础设施或运输技术中使用。
- 宣传伤害：避免宣传自残或暴力的内容。
欺骗性做法：
- 虚假信息：避免创建/宣传欺诈或误导性信息。
- 诽谤和垃圾邮件：避免发布诽谤性内容和未经请求的消息。
- 冒充：未经授权不得冒充他人。
- 虚假陈述：不得对AfroLlama的输出进行虚假声明。
- 虚假在线互动：不得宣传虚假的在线互动。

偏差、风险和局限性

AfroLlama是一项充满潜力的前沿技术，但也存在一些固有的风险。到目前为止，广泛的测试主要集中在斯瓦希里语、科萨语、祖鲁语、约鲁巴语、豪萨语和英语上，仍有大量未知的场景有待探索。因此，与其他大语言模型一样，AfroLlama的输出可预测性仍然难以捉摸，在用户提示下，它偶尔可能会生成不准确、有偏差或其他令人反感的响应。

考虑到这一点，在将AfroLlama部署到任何应用程序之前，开发者必须根据其特定用例的独特需求，进行认真的安全测试和细致的微调。