Tri 21B
T

Tri 21B

由trillionlabs開發
Tri-21B是一款旗艦級大語言模型,僅使用2T訓練令牌便達到最先進性能,重新定義了訓練效率邊界。
下載量 223
發布時間 : 7/19/2025

模型概述

Tri-21B是一款高效的大語言模型,專注於推理能力,支持多語言,並在多個基準測試中表現優異。

模型特點

高效訓練
僅使用2T令牌進行訓練,遠少於同類模型,同時在多個基準測試中實現70.3%的平均準確率。
突破帕累託邊界
僅需2.95E+23 FLOPs,性能超過需要2-10倍計算資源的模型。
增強推理能力
訓練數據集經過優化,專門提升推理能力。
先進的後訓練
改進強化學習訓練流程,專注於數學推理和日常使用。
多語言支持
針對韓語、英語和日語進行了特別優化。

模型能力

文本生成
問答系統
代碼生成
數學推理
多語言支持
指令遵循

使用案例

教育
解釋複雜概念
用簡單術語解釋量子計算等複雜概念
在MMLU基準測試中達到77.62%準確率
編程
代碼生成
根據描述生成代碼
HumanEval基準測試中達到75.61% pass@1
數學
數學問題解決
解決數學推理問題
GSM8k基準測試中達到87.95%準確率
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase