T

Telechat 7B

由Tele-AI開發
TeleChat是由中電信人工智能科技有限公司研發訓練的大語言模型,7B模型基座採用1.5萬億Tokens中英文高質量語料進行訓練,12B模型基座採用3萬億Tokens中英文高質量語料進行訓練。
下載量 238
發布時間 : 1/8/2024

模型概述

TeleChat是一個高性能的大語言模型,支持多輪對話、長文生成和代碼生成等多種任務,在通用問答和知識類、代碼類、數學類榜單上表現優異。

模型特點

高性能架構
採用旋轉位置編碼、SwiGLU激活函數和RMSNorm層標準化等先進技術,提升模型訓練速度和效果
多輪對話支持
針對多輪模型訓練集成了mask loss訓練方式,更好地聚焦多輪答案
長文生成能力
在工作總結、工作計劃、PPT大綱等長文寫作任務上表現優異
外推能力
採用NTK-aware外推和attention scaling外推方式,可以外推到96K

模型能力

文本生成
多輪對話
問答系統
代碼生成
數學推理
長文寫作

使用案例

辦公自動化
工作總結生成
自動生成詳細的工作總結報告
生成結構清晰、內容詳實的工作總結
PPT大綱生成
根據主題自動生成PPT內容大綱
生成邏輯清晰、結構合理的PPT大綱
教育
數學問題解答
解答各類數學問題和證明題
在GSM8K和MATH評測中表現優異
編程輔助
代碼生成
根據自然語言描述生成代碼
在HumanEval評測中表現良好
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase