G

Granite 3b Code Base 2k

ibm-graniteによって開発
Granite-3B-Code-Base-2KはIBM研究所が開発したコード生成タスク専用のデコーダのみモデルで、3Bパラメータ規模を持ち、116のプログラミング言語をサポートしています。
ダウンロード数 711
リリース時間 : 4/23/2024

モデル概要

このモデルは2段階のトレーニング戦略を採用しており、第1段階では4兆のコードトークンでトレーニングし、第2段階では5000億の高品質なコードと自然言語トークンでトレーニングし、コード生成、説明、修正などのタスクに焦点を当てています。

モデル特徴

2段階トレーニング戦略
第1段階では幅広いプログラミング言語データで事前トレーニングを行い、第2段階では精選された高品質データで微調整を行い、推論能力と指示追従能力を向上させます。
積極的な重複排除戦略
正確な重複排除技術とあいまいな重複排除技術を採用し、重複コードコンテンツを効果的に除去し、データ品質を向上させます。
包括的なセキュリティフィルタリング
HAPコンテンツフィルタリング、PII削除、マルウェアスキャンを適用し、モデルが有害なコンテンツを生成するリスクを低減します。

モデル能力

コード生成
コード説明
コード修正
ユニットテスト生成
ドキュメント生成
技術的負債の解決
脆弱性検出
コード翻訳

使用事例

ソフトウェア開発
Python関数生成
自然言語の説明に基づいてPython関数コードを自動生成
MBPPデータセットで通過率@1が36%
コード修正
エラーを含むコードスニペットを自動修正
HumanEval修正タスクでPython修正通過率18.3%
教育
コード説明
複雑なコードセグメントに対して自然言語の説明を生成
HumanEval説明タスクでPython説明通過率25%
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase