N

Neural Chat 7b V3 3

Intelによって開発
Neural-Chat-v3-3はインテルがMistral-7Bアーキテクチャに基づいて開発した70億パラメータの大規模言語モデルで、数学推論とテキスト生成タスクに特化しています。このモデルはMetaMathQAデータセットで微調整され、直接性能最適化(DPO)手法を用いてアライメントされています。
ダウンロード数 29.82k
リリース時間 : 12/9/2023

モデル概要

このモデルはIntel/neural-chat-7b-v3-1をmeta-math/MetaMathQAデータセットで微調整した70億パラメータの大規模言語モデルで、インテルGaudi 2プロセッサで訓練され、言語関連タスクの推論に適しています。

モデル特徴

数学推論能力
MetaMathQAデータセットで微調整されており、優れた数学問題解決能力を備えています
直接性能最適化
DPO(直接性能最適化)手法を用いたアライメント訓練を採用
Gaudi 2プロセッサ最適化
インテルGaudi 2プロセッサで特別に訓練・最適化
長文脈サポート
8192トークンの文脈長をサポート

モデル能力

数学問題解答
テキスト生成
論理推論
質問応答システム

使用事例

教育
数学指導
学生が様々な数学問題を理解し解決するのを支援
GSM8K数学データセットで61.11%の精度を達成
コンテンツ作成
テキスト生成
一貫性と論理性のあるテキストコンテンツを生成
HellaSwagデータセットで85.26%の精度を達成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase