N

Neural Chat 7b V3 3

由Intel開發
Neural-Chat-v3-3是英特爾基於Mistral-7B架構開發的70億參數大語言模型,專注於數學推理和文本生成任務。該模型在MetaMathQA數據集上微調,並採用直接性能優化(DPO)方法對齊。
下載量 29.82k
發布時間 : 12/9/2023

模型概述

該模型是基於Intel/neural-chat-7b-v3-1在meta-math/MetaMathQA數據集上微調的70億參數大語言模型,使用英特爾Gaudi 2處理器進行訓練,適用於語言相關任務推理。

模型特點

數學推理能力
在MetaMathQA數據集上微調,具備優秀的數學問題解決能力
直接性能優化
採用DPO(直接性能優化)方法進行對齊訓練
Gaudi 2處理器優化
專門在英特爾Gaudi 2處理器上訓練和優化
長上下文支持
支持8192個標記的上下文長度

模型能力

數學問題解答
文本生成
邏輯推理
問答系統

使用案例

教育
數學輔導
幫助學生理解和解決各種數學問題
在GSM8K數學數據集上達到61.11%準確率
內容創作
文本生成
生成連貫、有邏輯的文本內容
在HellaSwag數據集上達到85.26%準確率
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase