D

Dots.llm1.inst

由rednote-hilab開發
dots.llm1 是一個大規模的 MoE 模型,在 1420 億總參數中激活 140 億參數,性能可與最先進的模型相媲美。
下載量 440
發布時間 : 5/14/2025

模型概述

dots.llm1 是一個開源的大規模 MoE 模型,具有高效的數據處理管道和高性能推理能力,支持英語和中文。

模型特點

高效的數據處理
採用三階段數據處理框架,生成大規模、高質量和多樣化的預訓練數據。
無合成數據預訓練
基礎模型預訓練使用了 1.12 萬億高質量的非合成標記。
高性能與成本效率
推理時僅激活 140 億參數,兼具全面的能力和高計算效率。
創新的基礎設施
引入基於交錯 1F1B 流水線調度和高效分組 GEMM 實現的創新 MoE 全對全通信和計算重疊方案。
開放的模型動態
發佈了每 1 萬億標記訓練的中間模型檢查點,便於研究大語言模型的學習動態。

模型能力

文本生成
對話系統
代碼生成

使用案例

自然語言處理
文本補全
用於生成連貫的文本補全,適用於寫作輔助、內容生成等場景。
對話系統
用於構建智能對話系統,提供自然流暢的對話體驗。
編程輔助
代碼生成
用於生成代碼片段,如快速排序算法的實現。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase