CodeGemma - 2b - GGUFオープンソースコードモデル - 無料でデプロイ可能、コード補完と生成タスクをサポート

ホーム

Codegemma 2b GGUF

googleによって開発

CodeGemmaはGemmaをベースに構築された軽量なオープンソースコードモデルシリーズで、テキストからテキスト、テキストからコードへのデコーダモデルを含み、コード補完と生成タスクに特化しています。

大規模言語モデル #コード補完 #多言語コード生成 #IDEプラグインサポート

ダウンロード数 31

リリース時間 : 3/21/2024

モデル概要

CodeGemmaはGemmaをベースに構築された軽量なオープンソースコードモデルシリーズで、コード補完、コード生成、自然言語生成タスクに焦点を当てています。2Bと7Bパラメータバージョンを提供し、さまざまなシナリオに適しています。

モデル特徴

コード補完

コード補完タスクに最適化されており、複数のプログラミング言語をサポートします。

コード生成

自然言語のプロンプトに基づいて高品質なコードを生成できます。

軽量設計

2Bと7Bパラメータバージョンを提供し、さまざまな計算リソース要件に対応します。

責任あるAI

厳格な安全フィルタリングと倫理評価を経ており、GoogleのAI原則に準拠しています。

モデル能力

コード補完

コード生成

自然言語生成

対話

指示追従

使用事例

開発ツール

IDEプラグインサポート

開発環境に統合され、リアルタイムのコード補完提案を提供します。

開発効率を向上させ、コーディングエラーを減らします。

コード生成

自然言語の説明に基づいて完全なコードスニペットを生成します。

迅速なプロトタイプ開発や新しいプログラミング言語の学習に役立ちます。

教育

プログラミング教育支援

学生がプログラミング概念を理解し、文法修正を提供するのを支援します。

学習効率を向上させ、入門のハードルを下げます。

🚀 CodeGemma

CodeGemmaは、Gemmaをベースに構築された軽量なオープンコードモデルのコレクションです。コードの補完や生成、チャットなど、様々なコード関連タスクに対応しています。

🔗 関連リンク

モデルページ：CodeGemma
リソースと技術ドキュメント：
- 技術レポート
- 責任ある生成AIツールキット
利用規約：利用規約
著者：Google

⚠️ 重要提示

llama.cppや、Ollama、LM Studioなどの関連ツールでは、特に repeat-penalty を正しく設定してください。Georgi Gerganov（llama.cppの著者）は、https://huggingface.co/google/gemma-7b-it/discussions/38#65d7b14adb51f7c160769fa1 で彼の経験を共有しています。

✨ 主な機能

CodeGemmaは、3種類のバリアントがあり、それぞれ異なるコード関連タスクに特化しています。

	codegemma-2b	codegemma-7b	codegemma-7b-it
コード補完	✅	✅
自然言語からのコード生成		✅	✅
コードチャット			✅
命令追従			✅

📦 インストール

READMEに具体的なインストール手順が記載されていないため、このセクションをスキップします。

💻 使用例

基本的な使用法

$ cat non_prime
/// Write a rust function to identify non-prime numbers.
///
/// Examples:
/// >>> is_not_prime(2)
/// False
/// >>> is_not_prime(10)
/// True
pub fn is_not_prime(n: i32) -> bool {
$ main -m codegemma-2b.gguf --temp 0 --top-k 0 -f non_prime --log-disable --repeat-penalty 1.0
 /// Write a rust function to identify non-prime numbers.
///
/// Examples:
/// >>> is_not_prime(2)
/// False
/// >>> is_not_prime(10)
/// True
pub fn is_not_prime(n: i32) -> bool {
    for i in 2..n {
        if n % i == 0 {
            return true;
        }
    }
    false
}
<|file_separator|>

📚 ドキュメント

入力と出力

入力：
- 事前学習モデルバリアントの場合：コードの補完や生成シナリオではコードのプレフィックスやサフィックス、または自然言語のテキストやプロンプト
- 命令調整モデルバリアントの場合：自然言語のテキストやプロンプト
出力：
- 事前学習モデルバリアントの場合：中間埋め込み型のコード補完、コードおよび自然言語
- 命令調整モデルバリアントの場合：コードおよび自然言語

モデルデータ

学習データセット

Gemmaをベースモデルとして、CodeGemma 2Bおよび7Bの事前学習バリアントは、公開されているコードリポジトリ、オープンソースの数学データセット、および合成生成されたコードから主に英語のデータ約5000億トークンでさらに学習されています。

学習データの処理

以下のデータ前処理技術が適用されています。

FIM事前学習CodeGemmaモデルは、中間埋め込み型（FIM）タスクに焦点を当てています。モデルはPSMとSPMモードの両方で動作するように学習されています。私たちのFIM設定は、80％のFIM率で50-50のPSM/SPMです。
依存関係グラフベースのパッキングと単体テストベースの字句パッキング技術：実世界のアプリケーションとのモデルのアライメントを改善するために、各リポジトリ内で最も関連性の高いソースファイルを同じ場所に配置するように、学習例をプロジェクト/リポジトリレベルで構造化しました。具体的には、依存関係グラフベースのパッキングと単体テストベースの字句パッキングという2つのヒューリスティック技術を採用しました。
ドキュメントをプレフィックス、ミドル、サフィックスに分割する新しい技術を開発し、サフィックスが純粋なランダム分布ではなく、より構文的に自然なポイントから始まるようにしました。
セーフティ：Gemmaと同様に、当社のポリシーに沿って、個人情報のフィルタリング、CSAMフィルタリング、およびコンテンツの品質とセーフティに基づくその他のフィルタリングを含む厳格なセーフティフィルタリングを実施しています。

実装情報

ハードウェア

CodeGemmaは、最新世代のTensor Processing Unit (TPU)ハードウェア（TPUv5e）を使用して学習されました。

ソフトウェア

学習は、JAXとML Pathwaysを使用して行われました。

評価情報

評価アプローチ

CodeGemmaは、いくつかのドメインにまたがるさまざまな学術的ベンチマークで評価されています。

コード補完ベンチマーク：HumanEval Single LineおよびMultiple Line Infilling
コード生成ベンチマーク：HumanEval、MBPP、BabelCode（C++、C#、Go、Java、JavaScript、Kotlin、Python、Rust）
Q&A：BoolQ、PIQA、TriviaQA
自然言語：ARC-Challenge、HellaSwag、MMLU、WinoGrande
数学的推論：GSM8K、MATH

評価結果

コーディングベンチマーク

ベンチマーク	2B	7B	7B-IT
HumanEval	31.1	44.5	56.1
MBPP	43.6	56.2	54.2
HumanEval Single Line	78.41	76.09	68.25
HumanEval Multi Line	51.44	58.44	20.05
BC HE C++	24.2	32.9	42.2
BC HE C#	10.6	22.4	26.7
BC HE Go	20.5	21.7	28.6
BC HE Java	29.2	41.0	48.4
BC HE JavaScript	21.7	39.8	46.0
BC HE Kotlin	28.0	39.8	51.6
BC HE Python	21.7	42.2	48.4
BC HE Rust	26.7	34.1	36.0
BC MBPP C++	47.1	53.8	56.7
BC MBPP C#	28.7	32.5	41.2
BC MBPP Go	45.6	43.3	46.2
BC MBPP Java	41.8	50.3	57.3
BC MBPP JavaScript	45.3	58.2	61.4
BC MBPP Kotlin	46.8	54.7	59.9
BC MBPP Python	38.6	59.1	62.0
BC MBPP Rust	45.3	52.9	53.5

自然言語ベンチマーク

CodeGemma Natural Language Benchmarks

倫理とセーフティ

評価アプローチ

評価方法には、構造化された評価と、関連するコンテンツポリシーの内部レッドチーミングテストが含まれています。レッドチーミングは、それぞれ異なる目標と人間評価指標を持ついくつかの異なるチームによって実施されました。これらのモデルは、倫理とセーフティに関連するいくつかの異なるカテゴリに対して評価され、以下のようなものが含まれます。