Tri 21B
T

Tri 21B

Developed by trillionlabs
Tri-21B是一款旗舰级大语言模型,仅使用2T训练令牌便达到最先进性能,重新定义了训练效率边界。
Downloads 223
Release Time : 7/19/2025

Model Overview

Tri-21B是一款高效的大语言模型,专注于推理能力,支持多语言,并在多个基准测试中表现优异。

Model Features

高效训练
仅使用2T令牌进行训练,远少于同类模型,同时在多个基准测试中实现70.3%的平均准确率。
突破帕累托边界
仅需2.95E+23 FLOPs,性能超过需要2-10倍计算资源的模型。
增强推理能力
训练数据集经过优化,专门提升推理能力。
先进的后训练
改进强化学习训练流程,专注于数学推理和日常使用。
多语言支持
针对韩语、英语和日语进行了特别优化。

Model Capabilities

文本生成
问答系统
代码生成
数学推理
多语言支持
指令遵循

Use Cases

教育
解释复杂概念
用简单术语解释量子计算等复杂概念
在MMLU基准测试中达到77.62%准确率
编程
代码生成
根据描述生成代码
HumanEval基准测试中达到75.61% pass@1
数学
数学问题解决
解决数学推理问题
GSM8k基准测试中达到87.95%准确率
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase