SWE Llama 13b
S
SWE Llama 13b
princeton-nlpによって開発
CodeLlamaアーキテクチャを基にファインチューニングされたモデルで、GitHubのイシューやプルリクエストにおけるソフトウェアエンジニアリングタスクの処理に特化しています。
ダウンロード数 245
リリース時間 : 10/10/2023
モデル概要
SWE-Llamaは、実際のGitHubイシューやプルリクエストから抽出されたソフトウェアエンジニアリングタスク向けに最適化された修正パッチ生成専用モデルです。
モデル特徴
ソフトウェアエンジニアリングタスク向け最適化
GitHubイシューやプルリクエストにおけるソフトウェアエンジニアリングタスクの処理に特化して設計されています。
CodeLlamaアーキテクチャベース
CodeLlamaの強力なコード理解・生成能力を継承しています。
LoRAファインチューニング手法
注意力行列のみをLoRA手法でファインチューニングし、トレーニング効率を向上させています。
モデル能力
コードパッチ生成
ソフトウェア問題の修正
コード理解と分析
使用事例
オープンソースソフトウェアのメンテナンス
GitHubイシューの自動修正
GitHubイシューの説明に基づいて修正コードパッチを自動生成します。
SWE-benchベンチマークで3-4%の問題解決率を達成
コードレビュー支援
プルリクエストのレビュー
開発者がプルリクエスト内の問題を迅速に特定・修正するのを支援します。
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98