ReasonableLlama3-3B-Jr開源推理模型 - 免費部署增強推理且支持多語言處理

首頁

Reasonablellama3 3B Jr

由adeelahmad開發

基於LLaMA-3B構建的微調推理模型，增強推理能力，支持多語言處理

大型語言模型支持多種語言#多語言推理 #邊緣設備優化 #思維鏈增強

下載量 1,173

發布時間 : 3/4/2025

模型概述

ReasonableLlama-3B是一款基於LLaMA-3B構建的推理模型，經過微調增強了推理能力，支持多種語言處理任務。

模型特點

多語言支持

支持包括英語、德語、法語等8種語言的文本生成和推理

增強推理能力

經過專門微調，提升了模型的邏輯推理和鏈式思考能力

邊緣設備友好

作為小型LLM，適合在邊緣設備上部署運行

模型能力

多語言文本生成

邏輯推理

鏈式思考

指令跟隨

使用案例

教育

語言學習輔助

幫助學習者練習多語言寫作和閱讀理解

研究

小型LLM研究

用於研究小型語言模型在邊緣計算場景下的表現

🚀 ReasonableLlama-3B：一款微調的推理模型

ReasonableLlama-3B 是一款基於LLaMA - 3B構建的前沿推理模型。該模型經過精心微調，在邏輯思維、問題解決和創造性分析方面的能力得到顯著提升。

🚀 快速開始

歡迎使用 ReasonableLlama-3B，這是一個基於LLaMA - 3B構建的前沿推理模型。此模型經過精心微調，以增強其在邏輯思維、問題解決和創造性分析方面的能力。

Hugging Face鏈接：https://huggingface.co/adeelahmad/ReasonableLlama3-3B-Jr
Ollama鏈接：https://ollama.com/adeelahmad/ReasonableLLAMA-Jr-3b

✨ 主要特性

高級推理：在邏輯分析、問題解決和決策制定方面表現出色。
創造性思維：能夠生成創新的解決方案和想法。
基於課程的微調：在高質量數據集上進行訓練，以增強推理能力。

📦 安裝指南

集成方式：可以通過API或本地設置集成到現有系統中。
輸入支持：支持文本和圖像，充分利用Ollama的多功能特性。

🔧 技術細節

參數數量：30億參數
訓練過程：使用最先進的技術針對推理任務進行微調
專業化：針對特定的推理工作流程和場景進行了優化

📚 詳細文檔

概述

模型名稱：ReasonableLlama - 3B
基礎架構：LLaMA - 3B（具有30億參數的大語言模型）
用途：專為需要高級推理、問題解決和創造性思維的任務而設計

使用場景

研究：有助於複雜問題的解決和理論分析。
教育：輔助創建教育示例和問題集。
問題解決：幫助在各個領域生成創新的解決方案。

侷限性

範圍：僅限於單步推理；多跳推理是當前的重點改進領域。
數據偏差：由於數據集可能反映歷史偏差，使用時需謹慎考慮其來源。

貢獻

歡迎貢獻代碼！你可以在GitHub上fork項目、提交問題和拉取請求。你的見解將有助於推動未來的改進。

引用

特別感謝LLaMA的開發者提供了強大的基礎。
感謝為開源AI發展做出貢獻的社區。

📄 許可證

LLAMA 3.2社區許可協議

Llama 3.2版本發佈日期：2024年9月25日

“協議”指本協議中規定的使用、複製、分發和修改Llama材料的條款和條件。

“文檔”指Meta在https://llama.meta.com/doc/overview上發佈的隨Llama 3.2一起分發的規範、手冊和文檔。

“被許可方”或“你”指你，或你的僱主，或任何其他人或實體（如果你代表該人或實體簽訂本協議），且你已達到適用法律、規則或法規要求的提供法律同意的年齡，並且如果你代表僱主或其他人員或實體簽訂本協議，你具有約束他們的法律權力。

“Llama 3.2”指基礎大語言模型、軟件和算法，包括機器學習模型代碼、訓練好的模型權重、推理啟用代碼、訓練啟用代碼、微調啟用代碼以及Meta在https://www.llama.com/llama-downloads上分發的上述內容的其他元素。

“Llama材料”指Meta根據本協議提供的專有Llama 3.2和文檔（及其任何部分）的統稱。

“Meta”或“我們”指Meta Platforms Ireland Limited（如果你位於歐洲經濟區或瑞士，或者如果你是一個實體，你的主要營業地在歐洲經濟區或瑞士）和Meta Platforms, Inc.（如果你位於歐洲經濟區或瑞士以外）。

通過點擊下面的“我接受”，或使用或分發Llama材料的任何部分或元素，你同意受本協議約束。

許可權利和再分發
- a. 權利授予。你被授予在Meta體現在Llama材料中的知識產權或其他權利下的非排他性、全球性、不可轉讓且免版稅的有限許可，以使用、複製、分發、拷貝、創作衍生作品並對Llama材料進行修改。
- b. 再分發和使用
  - i. 如果你分發或提供Llama材料（或其任何衍生作品），或包含其中任何內容的產品或服務（包括另一個AI模型），你應（A）隨任何此類Llama材料提供本協議的副本；並且（B）在相關網站、用戶界面、博客文章、關於頁面或產品文檔上顯著顯示“Built with Llama”。如果你使用Llama材料或Llama材料的任何輸出或結果來創建、訓練、微調或以其他方式改進一個AI模型，並進行分發或提供該模型，你還應在任何此類AI模型名稱的開頭包含“Llama”。
  - ii. 如果你作為集成終端用戶產品的一部分從被許可方處接收Llama材料或其任何衍生作品，則本協議第2條不適用於你。
  - iii. 你必須在分發的所有Llama材料副本中，在作為此類副本一部分分發的“Notice”文本文件中保留以下歸屬聲明：“Llama 3.2 is licensed under the Llama 3.2 Community License, Copyright © Meta Platforms, Inc. All Rights Reserved.”
  - iv. 你對Llama材料的使用必須遵守適用的法律和法規（包括貿易合規法律和法規），並遵守Llama材料的可接受使用政策（可在https://www.llama.com/llama3_2/use-policy上獲取），該政策特此通過引用併入本協議。
額外商業條款。如果在Llama 3.2版本發佈日期，被許可方或其關聯方提供的產品或服務的月活躍用戶在前一個日曆月超過7億，你必須向Meta請求許可，Meta可自行決定是否授予你許可，並且在Meta明確授予你此類權利之前，你無權行使本協議下的任何權利。
保修免責聲明。除非適用法律要求，Llama材料及其任何輸出和結果按“現狀”提供，不提供任何形式的保證，Meta放棄所有明示和暗示的保證，包括但不限於所有權、不侵權、適銷性或特定用途適用性的保證。你獨自負責確定使用或再分發Llama材料的適當性，並承擔與你使用Llama材料及其任何輸出和結果相關的任何風險。
責任限制。在任何情況下，Meta或其關聯方均不對因本協議引起的任何利潤損失或任何間接、特殊、後果性、偶發性、懲戒性或懲罰性損害承擔責任，無論責任理論是合同、侵權、疏忽、產品責任還是其他，即使Meta或其關聯方已被告知此類損害的可能性。
知識產權
- a. 本協議未授予商標許可，關於Llama材料，除非在描述和再分發Llama材料時進行合理和慣常使用所需，或如本節5(a)所述，Meta和被許可方均不得使用對方或其任何關聯方擁有或關聯的任何名稱或標記。Meta特此授予你僅為遵守第1.b.i條最後一句的要求使用“Llama”（“標記”）的許可。你將遵守Meta的品牌指南（目前可在https://about.meta.com/brand/resources/meta/company-brand/上獲取）。你使用該標記產生的所有商譽將歸Meta所有。
- b. 鑑於Meta對Llama材料及其為Meta製作的衍生作品的所有權，關於你對Llama材料進行的任何衍生作品和修改，在你和Meta之間，你是且將是此類衍生作品和修改的所有者。
- c. 如果你對Meta或任何實體提起訴訟或其他法律程序（包括在訴訟中的交叉索賠或反訴），聲稱Llama材料或Llama 3.2的輸出或結果，或上述任何部分構成侵犯你擁有或可許可的知識產權或其他權利，則本協議授予你的任何許可將自此類訴訟或索賠提起之日起終止。你將賠償並使Meta免受因你使用或分發Llama材料而引起的或與之相關的任何第三方索賠。
期限和終止。本協議的期限自你接受本協議或訪問Llama材料時開始，並將持續有效，直至根據本協議的條款和條件終止。如果你違反本協議的任何條款或條件，Meta可終止本協議。本協議終止後，你應刪除並停止使用Llama材料。第3、4和7條在本協議終止後仍然有效。
適用法律和管轄權。本協議將受加利福尼亞州法律管轄並依其解釋，不考慮法律選擇原則，《聯合國國際貨物銷售合同公約》不適用於本協議。加利福尼亞州的法院對因本協議引起的任何爭議具有專屬管轄權。

Llama 3.2可接受使用政策

Meta致力於促進其工具和功能（包括Llama 3.2）的安全和公平使用。如果你訪問或使用Llama 3.2，即表示你同意本可接受使用政策（“政策”）。本政策的最新版本可在https://www.llama.com/llama3_2/use-policy上找到。

禁止使用情況

我們希望每個人都能安全、負責地使用Llama 3.2。你同意不會使用或允許他人使用Llama 3.2進行以下行為：

違反法律或他人權利，包括：
1. 從事、促進、生成、促成、鼓勵、策劃、煽動或進一步推動非法或違法活動或內容，例如：
  1. 暴力或恐怖主義
  2. 對兒童的剝削或傷害，包括招攬、創建、獲取或傳播兒童剝削內容，或未能報告兒童性虐待材料
  3. 人口販運、剝削和性暴力
  4. 向未成年人非法分發信息或材料，包括淫穢材料，或未能對此類信息或材料採用法律要求的年齡限制
  5. 性招攬
  6. 任何其他犯罪活動
2. 從事、促進、煽動或便利對個人或群體的騷擾、虐待、威脅或欺凌
3. 從事、促進、煽動或便利在就業、就業福利、信貸、住房、其他經濟福利或其他基本商品和服務的提供方面的歧視或其他非法或有害行為
4. 從事未經授權或無執照的任何專業實踐，包括但不限於金融、法律、醫療/健康或相關專業實踐
5. 收集、處理、披露、生成或推斷個人的私人或敏感信息，包括個人身份、健康或人口統計信息，除非你已根據適用法律獲得這樣做的權利
6. 從事或便利任何侵犯、盜用或以其他方式侵犯任何第三方權利的行為或生成任何內容，包括使用Llama材料的任何產品或服務的輸出或結果
7. 創建、生成或便利創建惡意代碼、惡意軟件、計算機病毒，或進行任何可能禁用、使負擔過重、干擾或損害網站或計算機系統的正常運行、完整性、操作或外觀的行為
8. 從事任何故意規避或移除使用限制或其他安全措施的行為，或啟用Meta禁用的功能
從事、促進、煽動、便利或協助策劃或開展對個人造成死亡或身體傷害風險的活動，包括與以下方面相關的Llama 3.2的使用：
1. 軍事、戰爭、核工業或應用、間諜活動、使用受美國國務院維護的《國際武器貿易條例》（ITAR）或1989年《美國生物武器反恐法》或1997年《化學武器公約實施法》管制的材料或活動
2. 槍支和非法武器（包括武器開發）
3. 非法藥物和受管制/受控物質
4. 關鍵基礎設施的運營、運輸技術或重型機械
5. 自我傷害或傷害他人，包括自殺、自殘和飲食失調
6. 任何旨在煽動或促進暴力、虐待或對個人造成身體傷害的內容
故意欺騙或誤導他人，包括與以下方面相關的Llama 3.2的使用：
1. 生成、促進或推動欺詐或虛假信息的創建或傳播
2. 生成、促進或推動誹謗性內容，包括創建誹謗性聲明、圖像或其他內容
3. 生成、促進或進一步分發垃圾郵件
4. 在未經同意、授權或合法權利的情況下冒充他人
5. 聲稱Llama 3.2的使用或輸出是人類生成的
6. 生成或便利虛假的在線互動，包括虛假評論和其他虛假在線互動方式
未能向終端用戶適當披露你的AI系統的任何已知危險
與旨在生成非法內容或從事非法或有害行為的第三方工具、模型或軟件進行交互，並且/或者聲稱此類工具、模型或軟件的輸出與Meta或Llama 3.2相關