CodeLlama-13b-Instruct-hfオープンソースコード生成モデル - 無料でのデプロイでコードアシスタントアプリを支援

ホーム

Codellama 13b Instruct Hf

codellamaによって開発

CodeLlama-13b-InstructはMetaがリリースした130億パラメータの命令チューニングコード生成モデルで、安全な命令追従とコードアシスタントアプリケーション向けに設計されています

大規模言語モデル

Transformers

その他#コード生成 #命令チューニング #多言語プログラミング

ダウンロード数 206.94k

リリース時間 : 8/24/2023

モデル概要

Llama 2アーキテクチャをベースに最適化されたコード生成大規模モデルで、汎用コード合成と理解をサポートし、命令版は微調整により実際の展開に適しています

モデル特徴

命令チューニング

命令微調整により、より安全なコード生成と対話型インタラクションを実現

多言語サポート

主要なプログラミング言語のコード生成と理解をサポート

高性能推論

最適化されたアーキテクチャにより効率的な推論速度を提供

モデル能力

コード補完

コード埋め込み

命令追従

コード解説

エラー修正提案

使用事例

開発支援

IDEプラグイン

開発環境に統合してリアルタイムのコード提案を提供

開発者の作業効率を向上

コードレビュー

コード品質を自動分析し改善提案を行う

手動レビュー作業の削減

教育

プログラミング教育

教育用サンプルコードと練習問題を生成

プログラミング初心者の学習を支援

🚀 Code Llama

Code Llamaは、70億から700億のパラメータ規模の事前学習および微調整された生成型テキストモデルのコレクションです。このリポジトリは、Hugging Face Transformers形式の13Bパラメータの命令調整済みバージョンです。このモデルは、一般的なコード合成と理解を目的として設計されています。他のモデルへのリンクは、下部のインデックスにあります。

⚠️ 重要提示

これは非公式のCode Llamaリポジトリです。公式のMetaリポジトリはMeta Llama organizationで見つけることができます。

🚀 クイックスタート

このモデルを使用するには、transformersをインストールする必要があります。

pip install transformers.git accelerate

✨ 主な機能

[x] コード補完
[x] コード挿入
[x] 命令応答 / チャット
[ ] Python特化

📚 ドキュメント

モデルの詳細

*注: このモデルの使用はMetaのライセンスに準拠しています。MetaはCode Llamaファミリーの大規模言語モデル（LLM）を開発し、公開しています。

モデル開発者 Meta

バリエーション Code Llamaには3つのモデルサイズと3つのバリエーションがあります。

Code Llama: 一般的なコード合成と理解を目的としたベースモデル
Code Llama - Python: Pythonに特化して設計されたモデル
Code Llama - Instruct: 命令に従い、より安全なデプロイを目的としたモデル

すべてのバリエーションは、7B、13B、34B、70Bのパラメータサイズで利用可能です。

このリポジトリには、13Bパラメータモデルの命令調整済みバージョンが含まれています。

入力モデルはテキストのみを入力とします。

出力モデルはテキストのみを生成します。

モデルアーキテクチャ Code Llamaは、最適化されたトランスフォーマーアーキテクチャを使用した自己回帰型言語モデルです。

モデルの日付 Code Llamaとそのバリエーションは、2023年1月から2023年7月の間に学習されました。

ステータス これはオフラインデータセットで学習された静的モデルです。Code Llama - Instructの将来のバージョンは、コミュニティからのフィードバックを元にモデルの安全性を改善しながらリリースされます。

意図された使用法

意図された使用事例 Code Llamaとそのバリエーションは、英語および関連するプログラミング言語における商用および研究目的で使用することを意図しています。ベースモデルのCode Llamaは、さまざまなコード合成と理解タスクに適応できます。Code Llama - PythonはPythonプログラミング言語を専門に扱うように設計されており、Code Llama - Instructはコードアシスタントや生成アプリケーションでより安全に使用することを意図しています。

範囲外の使用法 適用される法律や規制（貿易コンプライアンス法を含む）に違反する方法での使用。英語以外の言語での使用。Code Llamaとそのバリエーションの許容使用ポリシーおよびライセンス契約で禁止されている他の方法での使用。

ハードウェアとソフトウェア

学習要因 カスタム学習ライブラリを使用しました。リリースされたモデルの学習と微調整は、Metaの研究スーパークラスターで行われました。

炭素排出量 合計で、すべての9つのCode Llamaモデルの学習には、A100 - 80GB（TDP 350 - 400W）のハードウェアで40万GPU時間の計算が必要でした。推定総排出量は65.3tCO2eqで、その100％がMetaの持続可能性プログラムによって相殺されました。

学習データ

ここで報告されているすべての実験とリリースされたモデルは、Llama 2と同じデータを使用して異なる重みで学習および微調整されています（詳細は研究論文のセクション2と表1を参照）。

評価結果

研究論文のセクション3ではメインモデルの評価と詳細なアブレーション、セクション4では安全性評価を参照してください。

倫理的な考慮事項と制限事項

Code Llamaとそのバリエーションは、使用に伴うリスクを持つ新しい技術です。これまでに行われたテストは英語で行われており、すべてのシナリオを網羅していない、または網羅することができない。これらの理由から、すべてのLLMと同様に、Code Llamaの潜在的な出力は事前に予測することができず、モデルは場合によってはユーザーのプロンプトに対して不正確または不快な応答を生成する可能性があります。したがって、Code Llamaのアプリケーションをデプロイする前に、開発者はモデルの特定のアプリケーションに合わせた安全性テストとチューニングを行う必要があります。

詳細は責任ある使用ガイドを参照してください。

📄 ライセンス

カスタム商用ライセンスはhttps://ai.meta.com/resources/models-and-libraries/llama-downloads/で入手できます。

研究論文

詳細な情報は論文 "Code Llama: Open Foundation Models for Code" またはそのarXivページで見つけることができます。

モデルの一覧

	ベースモデル	Python	命令調整済み
7B	codellama/CodeLlama-7b-hf	codellama/CodeLlama-7b-Python-hf	codellama/CodeLlama-7b-Instruct-hf
13B	codellama/CodeLlama-13b-hf	codellama/CodeLlama-13b-Python-hf	codellama/CodeLlama-13b-Instruct-hf
34B	codellama/CodeLlama-34b-hf	codellama/CodeLlama-34b-Python-hf	codellama/CodeLlama-34b-Instruct-hf
70B	codellama/CodeLlama-70b-hf	codellama/CodeLlama-70b-Python-hf	codellama/CodeLlama-70b-Instruct-hf