Quasar-3.0-Final開源AI模型 - 創新技術支持，釋放架構早期潛力！

首頁

Quasar 3.0 Final

由silx-ai開發

Quasar-3.0-Max是SILX INC提供的7B參數蒸餾模型，展示了Quasar架構的早期潛力，採用創新的TTM訓練流程和強化學習技術。

大型語言模型

Transformers

#令牌溫度機制 #強化學習優化 #高效推理

下載量 118

發布時間 : 4/6/2025

模型概述

Quasar-3.0-Max是基於《推理中的黃金公式》論文技術構建的蒸餾模型，採用令牌溫度機制(TTM)優化推理和上下文聚焦，並應用強化學習訓練公式。

模型特點

令牌溫度機制(TTM)

創新的訓練流程，優化推理和上下文聚焦能力

強化學習訓練公式

應用了被認為是最佳的強化學習訓練方法

蒸餾技術

從即將發佈的400B Quasar 3.0模型蒸餾而來

模型能力

文本生成

複雜推理

上下文理解

使用案例

AI研究與開發

模型架構研究

研究新型訓練方法和架構設計

展示了Quasar架構的潛力

商業應用

智能助手

構建具有高級推理能力的AI助手

🚀 類星體系列模型

類星體系列模型由SILX INC提供，旨在通過創新的訓練機制和方法，提升模型在推理和上下文聚焦方面的能力，為人工智能領域的推理能力帶來新的突破。

🚀 快速開始

模型信息

屬性	詳情
基礎模型	Quasar-400B-X
庫名稱	transformers
模型名稱	Quasar-3.0-Max
標籤	rl、silx、trl、sft
許可證	license

模型圖片

類星體模型圖片

✨ 主要特性

介紹類星體3.0

此模型由SILX INC提供，類星體3.0 - 7B是即將推出的400B類星體3.0模型的蒸餾版本。它基於《推理中的黃金公式》（Golden Formula in Reasoning）論文中的創新成果構建，具有一種名為TTM（令牌溫度機制） 的新型訓練管道 —— 這是一種在訓練過程中優化推理和上下文聚焦的新方法。我們還應用了我們認為迄今為止強化學習（RL）訓練的最佳公式。