T

Tulu 65b

由allenai開發
Tulu 65B是基於多指令數據集微調的65B參數LLaMa模型,是開放資源指令調優研究的成果,綜合性能強勁。
下載量 20
發布時間 : 6/7/2023

模型概述

該模型通過FLAN V2、CoT、Dolly等多指令數據集微調,適用於多種自然語言處理任務,特別強調指令遵循能力。

模型特點

多指令數據集微調
整合FLAN V2、CoT、Dolly等7個高質量指令數據集進行訓練
嚴格輸入格式要求
採用特定對話格式(<|user|>/<|assistant|>標記)確保最佳生成效果
綜合性能優異
在MMLU、GSM、BBH等多個基準測試中表現突出

模型能力

指令理解與執行
多輪對話生成
複雜問題解答
代碼生成與解釋
知識推理

使用案例

智能助手
任務型對話系統
處理複雜多輪指令對話
在AlpacaFarm評估中優於Davinci-003模型
教育研究
開放域問答
回答各類知識性問題
在MMLU基準測試中5-shot準確率達61.1%
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase