T

Telechat 7B

由 Tele-AI 开发
TeleChat是由中电信人工智能科技有限公司研发训练的大语言模型,7B模型基座采用1.5万亿Tokens中英文高质量语料进行训练,12B模型基座采用3万亿Tokens中英文高质量语料进行训练。
下载量 238
发布时间 : 1/8/2024

模型简介

TeleChat是一个高性能的大语言模型,支持多轮对话、长文生成和代码生成等多种任务,在通用问答和知识类、代码类、数学类榜单上表现优异。

模型特点

高性能架构
采用旋转位置编码、SwiGLU激活函数和RMSNorm层标准化等先进技术,提升模型训练速度和效果
多轮对话支持
针对多轮模型训练集成了mask loss训练方式,更好地聚焦多轮答案
长文生成能力
在工作总结、工作计划、PPT大纲等长文写作任务上表现优异
外推能力
采用NTK-aware外推和attention scaling外推方式,可以外推到96K

模型能力

文本生成
多轮对话
问答系统
代码生成
数学推理
长文写作

使用案例

办公自动化
工作总结生成
自动生成详细的工作总结报告
生成结构清晰、内容详实的工作总结
PPT大纲生成
根据主题自动生成PPT内容大纲
生成逻辑清晰、结构合理的PPT大纲
教育
数学问题解答
解答各类数学问题和证明题
在GSM8K和MATH评测中表现优异
编程辅助
代码生成
根据自然语言描述生成代码
在HumanEval评测中表现良好
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase