S

Seed Coder Triton 8b V1

winglianによって開発
ByteDance - Seed/Seed - Coder - 8B - Baseモデルを特定のデータセットで微調整した大規模言語モデルで、長シーケンス入力と効率的なトレーニング戦略をサポートします。
ダウンロード数 1,388
リリース時間 : 5/13/2025

モデル概要

このモデルは、axolotl - ai - internal/gpumode - py2triton - reasoning - v2データセットでSeed - Coder - 8B - Baseを微調整した成果物で、特定分野のタスクニーズに適しています。

モデル特徴

長シーケンスサポート
最大16384のシーケンス入力をサポートし、長いテキストや複雑なコードの処理に適しています。
効率的なトレーニング戦略
サンプルのパッキングとパディング戦略を採用し、複数の最適化プラグインを組み合わせてトレーニング効率を向上させます。
最適化アーキテクチャ
LigerPluginなどの最適化技術を使用してモデルアーキテクチャを改善し、パフォーマンスを向上させます。

モデル能力

コード生成
論理推論
長テキスト処理

使用事例

コード関連
コード生成
要求に応じて特定の機能を持つコードを生成します。
評価セットでの損失値は0.2177です。
コード推論
既存のコードロジックを理解して分析します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase