CodeLlama - 70b - Python - hfオープンソースコード生成モデル - 無料でデプロイしてPythonコードを効率的に生成

ホーム

Codellama 70b Python Hf

codellamaによって開発

Code LlamaはMetaが開発した700億パラメータのPython専用コード生成モデルで、Llama-2アーキテクチャを基に最適化され、16kのコンテキスト長をサポートします

大規模言語モデル

Transformers

その他#700億パラメータ #Python専用 #コード生成

ダウンロード数 115

リリース時間 : 1/29/2024

モデル概要

Pythonコードの合成と理解のために特別に設計された70Bパラメータの大規模言語モデルで、Code LlamaシリーズのPython専用バージョンです

モデル特徴

Python特化

追加の1000億トークンのPythonコードで微調整されており、Python関連タスクで優れた性能を発揮します

長いコンテキストサポート

16kトークンのコンテキストウィンドウをサポートし、複雑なコードファイルの処理に適しています

商用ライセンス

llama2ライセンスを採用しており、条件を満たす商用利用が可能です

モデル能力

Pythonコード生成

コード補完

コード理解

コードコメント生成

コードリファクタリング提案

使用事例

開発ツール

IDEインテリジェント補完

開発環境に統合してコンテキストを認識したコード提案を提供します

開発者の効率を約30-50%向上させます

自動コードレビュー

コード品質を分析し、改善提案を行います

一般的なコードの臭いや潜在的なバグを識別できます

教育

プログラミング教育アシスタント

教育用のサンプルコードを生成したり、プログラミング概念を説明します

🚀 コードラマ

コードラマは、70億から700億のパラメータ規模の事前学習および微調整された生成型テキストモデルのコレクションです。これは、Hugging Face Transformers形式の70B Python専用バージョンのリポジトリです。このモデルは、一般的なコード合成と理解のために設計されています。他のモデルへのリンクは、下部のインデックスで見つけることができます。

🚀 クイックスタート

このモデルを使用するには、transformersをインストールする必要があります。

pip install transformers accelerate

✨ 主な機能

[x] コード補完
[ ] インフィリング
[ ] 命令追従 / チャット
[x] Python専用

📚 ドキュメント

モデルの詳細

*注: このモデルの使用は、Metaのライセンスに準拠しています。Metaは、Code Llamaファミリーの大規模言語モデル（LLM）を開発し、公開しています。

モデル開発者 Meta

バリエーション コードラマは4つのモデルサイズと3つのバリエーションがあります。

コードラマ: 一般的なコード合成と理解のために設計されたベースモデル
コードラマ - Python: Python専用に設計されています
コードラマ - Instruct: 命令追従とより安全なデプロイのためのモデル

すべてのバリエーションは、7B、13B、34B、70Bのパラメータサイズで利用可能です。

このリポジトリには、70BパラメータモデルのPythonバージョンが含まれています。

入力モデルはテキストのみを入力とします。

出力モデルはテキストのみを生成します。

モデルアーキテクチャ コードラマは、最適化されたトランスフォーマーアーキテクチャを使用する自己回帰型言語モデルです。最大16kトークンで微調整されています。このバリエーションは、最大100kトークンの長いコンテキストをサポートしていません。

モデルの日付 コードラマとそのバリエーションは、2023年1月から2024年1月の間に学習されました。

ステータス これは、オフラインデータセットで学習された静的モデルです。コミュニティのフィードバックを元にモデルの安全性を向上させるにつれて、コードラマ - Instructの将来のバージョンがリリースされます。

ライセンス カスタム商用ライセンスは、https://ai.meta.com/resources/models-and-libraries/llama-downloads/で入手できます。

研究論文 詳細な情報は、論文 "Code Llama: Open Foundation Models for Code" またはそのarXivページで見つけることができます。

想定される使用方法

想定される使用事例 コードラマとそのバリエーションは、英語および関連するプログラミング言語での商用および研究用途を想定しています。ベースモデルのコードラマは、さまざまなコード合成と理解タスクに適応でき、コードラマ - PythonはPythonプログラミング言語を専門に扱うように設計されており、コードラマ - Instructは、コードアシスタントや生成アプリケーションでの使用がより安全になるように設計されています。

想定外の使用方法 適用される法律や規制（貿易コンプライアンス法を含む）に違反する方法での使用。英語以外の言語での使用。コードラマとそのバリエーションの許容使用ポリシーおよびライセンス契約で禁止されている他の方法での使用。

ハードウェアとソフトウェア

学習要因 カスタム学習ライブラリを使用しました。リリースされたモデルの学習と微調整は、Metaの研究スーパークラスターで行われました。

炭素排出量 合計で、12のコードラマモデルすべてを学習するには、A100 - 80GB（TDP 350 - 400W）タイプのハードウェアで1400K GPU時間の計算が必要でした。推定総排出量は228.55tCO2eqで、その100％がMetaの持続可能性プログラムによって相殺されました。

評価結果

研究論文のセクション3の主要モデルの評価と詳細なアブレーション、セクション4の安全性評価を参照してください。

倫理的考慮事項と制限事項

コードラマとそのバリエーションは、使用に伴うリスクを持つ新しい技術です。これまでに行われたテストは英語で行われており、すべてのシナリオを網羅していない、または網羅することができない。これらの理由から、すべてのLLMと同様に、コードラマの潜在的な出力を事前に予測することはできず、モデルは場合によっては、ユーザーのプロンプトに対して不正確または不快な応答を生成する可能性があります。したがって、コードラマのアプリケーションをデプロイする前に、開発者はモデルの特定のアプリケーションに合わせた安全性テストとチューニングを行う必要があります。

https://ai.meta.com/llama/responsible-use-guideで利用可能な責任ある使用ガイドを参照してください。

モデルの一覧

	ベースモデル	Python	Instruct
7B	codellama/CodeLlama-7b-hf	codellama/CodeLlama-7b-Python-hf	codellama/CodeLlama-7b-Instruct-hf
13B	codellama/CodeLlama-13b-hf	codellama/CodeLlama-13b-Python-hf	codellama/CodeLlama-13b-Instruct-hf
34B	codellama/CodeLlama-34b-hf	codellama/CodeLlama-34b-Python-hf	codellama/CodeLlama-34b-Instruct-hf
70B	codellama/CodeLlama-70b-hf	codellama/CodeLlama-70b-Python-hf	codellama/CodeLlama-70b-Instruct-hf