ReasonableLlama3-3B-Jr开源推理模型 - 免费部署增强推理且支持多语言处理

首页

Reasonablellama3 3B Jr

由 adeelahmad 开发

基于LLaMA-3B构建的微调推理模型，增强推理能力，支持多语言处理

大型语言模型支持多种语言#多语言推理 #边缘设备优化 #思维链增强

下载量 1,173

发布时间 : 3/4/2025

模型简介

ReasonableLlama-3B是一款基于LLaMA-3B构建的推理模型，经过微调增强了推理能力，支持多种语言处理任务。

模型特点

多语言支持

支持包括英语、德语、法语等8种语言的文本生成和推理

增强推理能力

经过专门微调，提升了模型的逻辑推理和链式思考能力

边缘设备友好

作为小型LLM，适合在边缘设备上部署运行

模型能力

多语言文本生成

逻辑推理

链式思考

指令跟随

使用案例

教育

语言学习辅助

帮助学习者练习多语言写作和阅读理解

研究

小型LLM研究

用于研究小型语言模型在边缘计算场景下的表现

🚀 ReasonableLlama-3B：一款微调的推理模型

ReasonableLlama-3B 是一款基于LLaMA - 3B构建的前沿推理模型。该模型经过精心微调，在逻辑思维、问题解决和创造性分析方面的能力得到显著提升。

🚀 快速开始

欢迎使用 ReasonableLlama-3B，这是一个基于LLaMA - 3B构建的前沿推理模型。此模型经过精心微调，以增强其在逻辑思维、问题解决和创造性分析方面的能力。

Hugging Face链接：https://huggingface.co/adeelahmad/ReasonableLlama3-3B-Jr
Ollama链接：https://ollama.com/adeelahmad/ReasonableLLAMA-Jr-3b

✨ 主要特性

高级推理：在逻辑分析、问题解决和决策制定方面表现出色。
创造性思维：能够生成创新的解决方案和想法。
基于课程的微调：在高质量数据集上进行训练，以增强推理能力。

📦 安装指南

集成方式：可以通过API或本地设置集成到现有系统中。
输入支持：支持文本和图像，充分利用Ollama的多功能特性。

🔧 技术细节

参数数量：30亿参数
训练过程：使用最先进的技术针对推理任务进行微调
专业化：针对特定的推理工作流程和场景进行了优化

📚 详细文档

概述

模型名称：ReasonableLlama - 3B
基础架构：LLaMA - 3B（具有30亿参数的大语言模型）
用途：专为需要高级推理、问题解决和创造性思维的任务而设计

使用场景

研究：有助于复杂问题的解决和理论分析。
教育：辅助创建教育示例和问题集。
问题解决：帮助在各个领域生成创新的解决方案。

局限性

范围：仅限于单步推理；多跳推理是当前的重点改进领域。
数据偏差：由于数据集可能反映历史偏差，使用时需谨慎考虑其来源。

贡献

欢迎贡献代码！你可以在GitHub上fork项目、提交问题和拉取请求。你的见解将有助于推动未来的改进。

引用

特别感谢LLaMA的开发者提供了强大的基础。
感谢为开源AI发展做出贡献的社区。

📄 许可证

LLAMA 3.2社区许可协议

Llama 3.2版本发布日期：2024年9月25日

“协议”指本协议中规定的使用、复制、分发和修改Llama材料的条款和条件。

“文档”指Meta在https://llama.meta.com/doc/overview上发布的随Llama 3.2一起分发的规范、手册和文档。

“被许可方”或“你”指你，或你的雇主，或任何其他人或实体（如果你代表该人或实体签订本协议），且你已达到适用法律、规则或法规要求的提供法律同意的年龄，并且如果你代表雇主或其他人员或实体签订本协议，你具有约束他们的法律权力。

“Llama 3.2”指基础大语言模型、软件和算法，包括机器学习模型代码、训练好的模型权重、推理启用代码、训练启用代码、微调启用代码以及Meta在https://www.llama.com/llama-downloads上分发的上述内容的其他元素。

“Llama材料”指Meta根据本协议提供的专有Llama 3.2和文档（及其任何部分）的统称。

“Meta”或“我们”指Meta Platforms Ireland Limited（如果你位于欧洲经济区或瑞士，或者如果你是一个实体，你的主要营业地在欧洲经济区或瑞士）和Meta Platforms, Inc.（如果你位于欧洲经济区或瑞士以外）。

通过点击下面的“我接受”，或使用或分发Llama材料的任何部分或元素，你同意受本协议约束。

许可权利和再分发
- a. 权利授予。你被授予在Meta体现在Llama材料中的知识产权或其他权利下的非排他性、全球性、不可转让且免版税的有限许可，以使用、复制、分发、拷贝、创作衍生作品并对Llama材料进行修改。
- b. 再分发和使用
  - i. 如果你分发或提供Llama材料（或其任何衍生作品），或包含其中任何内容的产品或服务（包括另一个AI模型），你应（A）随任何此类Llama材料提供本协议的副本；并且（B）在相关网站、用户界面、博客文章、关于页面或产品文档上显著显示“Built with Llama”。如果你使用Llama材料或Llama材料的任何输出或结果来创建、训练、微调或以其他方式改进一个AI模型，并进行分发或提供该模型，你还应在任何此类AI模型名称的开头包含“Llama”。
  - ii. 如果你作为集成终端用户产品的一部分从被许可方处接收Llama材料或其任何衍生作品，则本协议第2条不适用于你。
  - iii. 你必须在分发的所有Llama材料副本中，在作为此类副本一部分分发的“Notice”文本文件中保留以下归属声明：“Llama 3.2 is licensed under the Llama 3.2 Community License, Copyright © Meta Platforms, Inc. All Rights Reserved.”
  - iv. 你对Llama材料的使用必须遵守适用的法律和法规（包括贸易合规法律和法规），并遵守Llama材料的可接受使用政策（可在https://www.llama.com/llama3_2/use-policy上获取），该政策特此通过引用并入本协议。
额外商业条款。如果在Llama 3.2版本发布日期，被许可方或其关联方提供的产品或服务的月活跃用户在前一个日历月超过7亿，你必须向Meta请求许可，Meta可自行决定是否授予你许可，并且在Meta明确授予你此类权利之前，你无权行使本协议下的任何权利。
保修免责声明。除非适用法律要求，Llama材料及其任何输出和结果按“现状”提供，不提供任何形式的保证，Meta放弃所有明示和暗示的保证，包括但不限于所有权、不侵权、适销性或特定用途适用性的保证。你独自负责确定使用或再分发Llama材料的适当性，并承担与你使用Llama材料及其任何输出和结果相关的任何风险。
责任限制。在任何情况下，Meta或其关联方均不对因本协议引起的任何利润损失或任何间接、特殊、后果性、偶发性、惩戒性或惩罚性损害承担责任，无论责任理论是合同、侵权、疏忽、产品责任还是其他，即使Meta或其关联方已被告知此类损害的可能性。
知识产权
- a. 本协议未授予商标许可，关于Llama材料，除非在描述和再分发Llama材料时进行合理和惯常使用所需，或如本节5(a)所述，Meta和被许可方均不得使用对方或其任何关联方拥有或关联的任何名称或标记。Meta特此授予你仅为遵守第1.b.i条最后一句的要求使用“Llama”（“标记”）的许可。你将遵守Meta的品牌指南（目前可在https://about.meta.com/brand/resources/meta/company-brand/上获取）。你使用该标记产生的所有商誉将归Meta所有。
- b. 鉴于Meta对Llama材料及其为Meta制作的衍生作品的所有权，关于你对Llama材料进行的任何衍生作品和修改，在你和Meta之间，你是且将是此类衍生作品和修改的所有者。
- c. 如果你对Meta或任何实体提起诉讼或其他法律程序（包括在诉讼中的交叉索赔或反诉），声称Llama材料或Llama 3.2的输出或结果，或上述任何部分构成侵犯你拥有或可许可的知识产权或其他权利，则本协议授予你的任何许可将自此类诉讼或索赔提起之日起终止。你将赔偿并使Meta免受因你使用或分发Llama材料而引起的或与之相关的任何第三方索赔。
期限和终止。本协议的期限自你接受本协议或访问Llama材料时开始，并将持续有效，直至根据本协议的条款和条件终止。如果你违反本协议的任何条款或条件，Meta可终止本协议。本协议终止后，你应删除并停止使用Llama材料。第3、4和7条在本协议终止后仍然有效。
适用法律和管辖权。本协议将受加利福尼亚州法律管辖并依其解释，不考虑法律选择原则，《联合国国际货物销售合同公约》不适用于本协议。加利福尼亚州的法院对因本协议引起的任何争议具有专属管辖权。

Llama 3.2可接受使用政策

Meta致力于促进其工具和功能（包括Llama 3.2）的安全和公平使用。如果你访问或使用Llama 3.2，即表示你同意本可接受使用政策（“政策”）。本政策的最新版本可在https://www.llama.com/llama3_2/use-policy上找到。

禁止使用情况

我们希望每个人都能安全、负责地使用Llama 3.2。你同意不会使用或允许他人使用Llama 3.2进行以下行为：

违反法律或他人权利，包括：
1. 从事、促进、生成、促成、鼓励、策划、煽动或进一步推动非法或违法活动或内容，例如：
  1. 暴力或恐怖主义
  2. 对儿童的剥削或伤害，包括招揽、创建、获取或传播儿童剥削内容，或未能报告儿童性虐待材料
  3. 人口贩运、剥削和性暴力
  4. 向未成年人非法分发信息或材料，包括淫秽材料，或未能对此类信息或材料采用法律要求的年龄限制
  5. 性招揽
  6. 任何其他犯罪活动
2. 从事、促进、煽动或便利对个人或群体的骚扰、虐待、威胁或欺凌
3. 从事、促进、煽动或便利在就业、就业福利、信贷、住房、其他经济福利或其他基本商品和服务的提供方面的歧视或其他非法或有害行为
4. 从事未经授权或无执照的任何专业实践，包括但不限于金融、法律、医疗/健康或相关专业实践
5. 收集、处理、披露、生成或推断个人的私人或敏感信息，包括个人身份、健康或人口统计信息，除非你已根据适用法律获得这样做的权利
6. 从事或便利任何侵犯、盗用或以其他方式侵犯任何第三方权利的行为或生成任何内容，包括使用Llama材料的任何产品或服务的输出或结果
7. 创建、生成或便利创建恶意代码、恶意软件、计算机病毒，或进行任何可能禁用、使负担过重、干扰或损害网站或计算机系统的正常运行、完整性、操作或外观的行为
8. 从事任何故意规避或移除使用限制或其他安全措施的行为，或启用Meta禁用的功能
从事、促进、煽动、便利或协助策划或开展对个人造成死亡或身体伤害风险的活动，包括与以下方面相关的Llama 3.2的使用：
1. 军事、战争、核工业或应用、间谍活动、使用受美国国务院维护的《国际武器贸易条例》（ITAR）或1989年《美国生物武器反恐法》或1997年《化学武器公约实施法》管制的材料或活动
2. 枪支和非法武器（包括武器开发）
3. 非法药物和受管制/受控物质
4. 关键基础设施的运营、运输技术或重型机械
5. 自我伤害或伤害他人，包括自杀、自残和饮食失调
6. 任何旨在煽动或促进暴力、虐待或对个人造成身体伤害的内容
故意欺骗或误导他人，包括与以下方面相关的Llama 3.2的使用：
1. 生成、促进或推动欺诈或虚假信息的创建或传播
2. 生成、促进或推动诽谤性内容，包括创建诽谤性声明、图像或其他内容
3. 生成、促进或进一步分发垃圾邮件
4. 在未经同意、授权或合法权利的情况下冒充他人
5. 声称Llama 3.2的使用或输出是人类生成的
6. 生成或便利虚假的在线互动，包括虚假评论和其他虚假在线互动方式
未能向终端用户适当披露你的AI系统的任何已知危险
与旨在生成非法内容或从事非法或有害行为的第三方工具、模型或软件进行交互，并且/或者声称此类工具、模型或软件的输出与Meta或Llama 3.2相关