O

Orca Mini 3b

由pankajmathur開發
orca_mini_3b是基於OpenLLaMa-3B模型訓練的文本生成模型,採用了來自WizardLM、Alpaca和Dolly-V2數據集的指令和輸入進行解釋性調優,並應用了Orca研究論文中的數據集構建方法。
下載量 4,232
發布時間 : 6/22/2023

模型概述

該模型是一個3B參數的文本生成模型,通過解釋性調優方法訓練,能夠生成高質量的文本響應。它特別適合需要理解複雜指令並生成詳細解釋的應用場景。

模型特點

解釋性調優
採用Orca研究論文中的方法,通過系統指令生成自定義數據集,使模型能夠學習思考過程。
多數據集訓練
結合了WizardLM、Alpaca和Dolly-V2數據集,提供了豐富的指令和輸入樣本。
高效訓練
使用DeepSpeed和ZeRO階段3優化,在8塊A100 GPU上僅需4小時完成訓練。

模型能力

文本生成
指令理解
解釋性響應生成

使用案例

教育
教學輔助
生成詳細的解釋和示例,幫助學生理解複雜概念。
內容創作
文章生成
根據指令生成高質量的文章或段落。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase