S

Seed Coder Triton 8b V1

由 winglian 开发
基于ByteDance-Seed/Seed-Coder-8B-Base模型在特定数据集上微调的大语言模型,支持长序列输入和高效训练策略。
下载量 1,388
发布时间 : 5/13/2025

模型简介

该模型是在axolotl-ai-internal/gpumode-py2triton-reasoning-v2数据集上对Seed-Coder-8B-Base进行微调的成果,适用于特定领域的任务需求。

模型特点

长序列支持
支持长达16384的序列输入,适合处理长文本或复杂代码
高效训练策略
采用样本打包和填充策略,结合多种优化插件,提高训练效率
优化架构
使用LigerPlugin等优化技术改进模型架构,提升性能

模型能力

代码生成
逻辑推理
长文本处理

使用案例

代码相关
代码生成
根据需求生成特定功能的代码
在评估集上损失值为0.2177
代码推理
理解和分析现有代码逻辑
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase