A

Airoboros Dpo 70b 3.3

由jondurbin開發
基於Meta的Llama-3構建的實驗性模型,使用airoboros生成的合成數據進行調優,並結合多種DPO數據集進行額外調優,擅長上下文問答、摘要生成、長文本生成等多種任務。
下載量 9,119
發布時間 : 5/10/2024

模型概述

該模型是對Llama-3-70b-instruct的微調版本,主要基於合成數據進行訓練,支持多種複雜任務處理。

模型特點

多數據集訓練
使用多個高質量數據集進行訓練,包括airoboros-3.2、boolq等,提高了模型的泛化能力。
多功能支持
支持上下文問答、摘要生成、長文本生成、代碼生成、函數調用等多種複雜任務。
特定格式支持
支持特定的提示格式,如封閉上下文問答格式,有助於模型更好地理解和處理輸入。
DPO調優
結合多種DPO數據集進行額外調優,提高了模型的響應質量和準確性。

模型能力

上下文問答
文本摘要
長文本生成
代碼生成
函數調用
思維鏈推理
執行計劃生成
多步驟指令確認

使用案例

知識問答
封閉上下文問答
根據提供的上下文回答問題,避免知識幻覺
能準確基於上下文回答,並提供來源引用
內容生成
長文本創作
根據詳細提示生成2300字左右的敘事文本
能生成結構完整、符合要求的文學作品
技術文檔摘要
將長文本摘要為130字左右的精簡內容
能保留關鍵信息並大幅壓縮內容
開發輔助
代碼生成
根據需求生成完整Python應用代碼
能生成符合要求的可運行代碼
函數調用
將自然語言指令轉換為函數調用參數
能準確識別意圖並生成正確的JSON格式調用
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase