CodeLlama-34b-Python-hfオープンソースコード生成モデル

ホーム

Codellama 34b Python Hf

codellamaによって開発

コードラマ(Code Llama)はMetaが開発した340億パラメータのPython専用コード生成モデルで、Llama 2アーキテクチャを基に最適化され、Pythonコードの合成と理解に特化しています

大規模言語モデル

Transformers

その他#Pythonコード生成 #340億パラメータ #自己回帰アーキテクチャ

ダウンロード数 2,135

リリース時間 : 8/24/2023

モデル概要

このモデルはコードラマシリーズのPython専用バージョンで、Pythonプログラミング言語向けに特別に最適化されており、コード生成、補完、理解タスクに適しています

モデル特徴

Python専用最適化

Python言語特性に特化して訓練・最適化されており、Pythonコード関連タスクで優れた性能を発揮します

大規模パラメータ

340億パラメータの規模が強力なコード理解と生成能力を提供します

商用利用可能

Llama 2ライセンスに基づき、商用利用が許可されています

コード補完機能

高品質なコード自動補完機能をサポートしています

モデル能力

Pythonコード生成

コード補完

コード理解

テキスト生成

使用事例

開発支援

コード自動補完

IDEでインテリジェントなコード補完提案を提供します

開発効率を向上させ、コーディングエラーを減少させます

コード生成

自然言語記述に基づいてPythonコードを生成します

迅速なプロトタイプ開発を可能にし、コーディングのハードルを下げます

教育

プログラミング教育

Pythonプログラミング教育の補助ツールとして利用できます

学生がコード構造とロジックを理解するのを助けます

🚀 Code Llama

Code Llamaは、70億から340億のパラメータ規模の事前学習および微調整された生成型テキストモデルのコレクションです。このリポジトリは、Hugging Face Transformers形式の34B Python専用バージョンのものです。このモデルは、一般的なコード合成と理解のために設計されています。他のモデルへのリンクは、下部のインデックスに記載されています。

⚠️ 重要提示

これは非公式のCode Llamaリポジトリです。公式のMetaリポジトリはMeta Llama organizationで見つけることができます。

モデルサイズ	ベースモデル	Python	インストラクション
7B	codellama/CodeLlama-7b-hf	codellama/CodeLlama-7b-Python-hf	codellama/CodeLlama-7b-Instruct-hf
13B	codellama/CodeLlama-13b-hf	codellama/CodeLlama-13b-Python-hf	codellama/CodeLlama-13b-Instruct-hf
34B	codellama/CodeLlama-34b-hf	codellama/CodeLlama-34b-Python-hf	codellama/CodeLlama-34b-Instruct-hf
70B	codellama/CodeLlama-70b-hf	codellama/CodeLlama-70b-Python-hf	codellama/CodeLlama-70b-Instruct-hf

🚀 クイックスタート

このモデルを使用するには、transformersをインストールする必要があります。

pip install transformers accelerate

✨ 主な機能

[x] コード補完
[ ] 穴埋め
[ ] インストラクション / チャット
[x] Python専用

📚 ドキュメント

モデルの詳細

*注: このモデルの使用はMetaのライセンスによって管理されています。MetaはCode Llamaファミリーの大規模言語モデル（LLM）を開発し、公開しています。

モデル開発者 Meta

バリエーション Code Llamaは3つのモデルサイズと3つのバリエーションがあります。

Code Llama: 一般的なコード合成と理解のために設計されたベースモデル
Code Llama - Python: Python専用に設計されています
Code Llama - Instruct: 命令に従い、より安全な展開のためのもの

すべてのバリエーションは、7B、13B、34Bのパラメータサイズで利用可能です。

このリポジトリには、34BパラメータモデルのPythonバージョンが含まれています。

入力モデルはテキストのみを入力とします。

出力モデルはテキストのみを生成します。

モデルアーキテクチャ Code Llamaは、最適化されたトランスフォーマーアーキテクチャを使用する自己回帰型言語モデルです。

モデルの日付 Code Llamaとそのバリエーションは、2023年1月から2023年7月の間に学習されました。

ステータス これはオフラインデータセットで学習された静的モデルです。Code Llama - Instructの将来のバージョンは、コミュニティのフィードバックを元にモデルの安全性を改善した後にリリースされます。

ライセンス カスタム商用ライセンスは次のURLで入手できます: https://ai.meta.com/resources/models-and-libraries/llama-downloads/

研究論文 詳細は論文 "Code Llama: Open Foundation Models for Code" またはそのarXivページを参照してください。

想定される使用方法

想定される使用事例 Code Llamaとそのバリエーションは、英語および関連するプログラミング言語における商用および研究用途を想定しています。ベースモデルのCode Llamaは、さまざまなコード合成と理解タスクに適応できます。Code Llama - PythonはPythonプログラミング言語を扱うために特別に設計されており、Code Llama - Instructはコードアシスタントや生成アプリケーションでより安全に使用できるように設計されています。

想定外の使用方法 適用される法律や規制（貿易コンプライアンス法を含む）に違反する方法での使用。英語以外の言語での使用。Code Llamaとそのバリエーションの許容使用ポリシーとライセンス契約で禁止されている他の方法での使用。

ハードウェアとソフトウェア

学習要因 カスタム学習ライブラリを使用しました。公開されたモデルの学習と微調整は、MetaのResearch Super Clusterで行われました。

二酸化炭素排出量 合計で、9つのCode Llamaモデルの学習には、A100 - 80GBタイプのハードウェア（TDP 350 - 400W）で40万GPU時間の計算が必要でした。推定総排出量は65.3tCO2eqで、その100％がMetaの持続可能性プログラムによって相殺されました。

学習データ

ここで報告されているすべての実験と公開されたモデルは、Llama 2と同じデータを異なる重みで使用して学習および微調整されています（詳細は研究論文のセクション2と表1を参照）。

評価結果

研究論文のセクション3の主要モデルの評価と詳細なアブレーション、およびセクション4の安全性評価を参照してください。

倫理的な考慮事項と制限事項

Code Llamaとそのバリエーションは、使用に伴うリスクを持つ新しい技術です。これまでに行われたテストは英語で行われており、すべてのシナリオを網羅していない、または網羅することができない。これらの理由から、すべてのLLMと同様に、Code Llamaの潜在的な出力を事前に予測することはできず、モデルは場合によってはユーザーのプロンプトに対して不正確または不快な応答を生成する可能性があります。したがって、Code Llamaのアプリケーションを展開する前に、開発者はモデルの特定のアプリケーションに合わせた安全性テストとチューニングを行う必要があります。

詳細は責任ある使用ガイドを参照してください。