S

Seed Coder Triton 8b V1

由winglian開發
基於ByteDance-Seed/Seed-Coder-8B-Base模型在特定數據集上微調的大語言模型,支持長序列輸入和高效訓練策略。
下載量 1,388
發布時間 : 5/13/2025

模型概述

該模型是在axolotl-ai-internal/gpumode-py2triton-reasoning-v2數據集上對Seed-Coder-8B-Base進行微調的成果,適用於特定領域的任務需求。

模型特點

長序列支持
支持長達16384的序列輸入,適合處理長文本或複雜代碼
高效訓練策略
採用樣本打包和填充策略,結合多種優化插件,提高訓練效率
優化架構
使用LigerPlugin等優化技術改進模型架構,提升性能

模型能力

代碼生成
邏輯推理
長文本處理

使用案例

代碼相關
代碼生成
根據需求生成特定功能的代碼
在評估集上損失值為0.2177
代碼推理
理解和分析現有代碼邏輯
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase