code_trans_t5_base_api_generation_multitask_finetune開源模型

首頁

Code Trans T5 Base Api Generation Multitask Finetune

由SEBIS開發

基於T5架構的預訓練模型，專為Java API推薦生成任務設計，通過多任務訓練優化性能

大型語言模型 #Java API推薦 #多任務預訓練 #代碼生成

下載量 16

發布時間 : 3/2/2022

模型概述

該模型基於t5-base架構，經過多任務預訓練和特定微調，主要用於生成Java編程任務的API使用建議

模型特點

多任務預訓練

在軟件開發領域的13個監督任務和7個無監督數據集上進行預訓練，增強模型泛化能力

特定任務微調

針對Java API推薦生成任務進行專門微調，提高特定場景下的表現

高性能表現

在代碼文檔生成任務中取得73.39的BLEU評分，超越當前最優技術

模型能力

Java API推薦生成

代碼文檔生成

編程輔助

使用案例

軟件開發

Java API推薦

根據代碼上下文自動推薦合適的Java API使用方案

提高開發效率，減少API查找時間

代碼文檔生成

自動為Java代碼生成說明文檔

BLEU評分達73.39，質量優於現有技術

🚀 CodeTrans模型用於API推薦生成

CodeTrans模型基於t5基礎模型架構進行預訓練，可用於生成API推薦。它能為Java編程任務生成API使用建議，為軟件開發提供了有力支持。該模型首次發佈於this repository。

🚀 快速開始

本模型可用於為Java編程任務生成API使用建議。以下是使用Transformers的SummarizationPipeline來生成Java函數文檔的示例代碼：

from transformers import AutoTokenizer, AutoModelWithLMHead, SummarizationPipeline

pipeline = SummarizationPipeline(
    model=AutoModelWithLMHead.from_pretrained("SEBIS/code_trans_t5_base_api_generation_multitask_finetune"),
    tokenizer=AutoTokenizer.from_pretrained("SEBIS/code_trans_t5_base_api_generation_multitask_finetune", skip_special_tokens=True),
    device=0
)

tokenized_code = "parse the uses licence node of this package , if any , and returns the license definition if theres"
pipeline([tokenized_code])

你可以在colab notebook中運行此示例。

✨ 主要特性

基於t5-base模型構建，擁有自己的SentencePiece詞彙模型。
採用多任務訓練，在軟件開發領域的13個監督任務和7個無監督數據集上進行訓練。
針對Java API的API推薦生成任務進行了微調。

📦 安裝指南

文檔未提及具體安裝步驟，暫不提供。

💻 使用示例

基礎用法

from transformers import AutoTokenizer, AutoModelWithLMHead, SummarizationPipeline

pipeline = SummarizationPipeline(
    model=AutoModelWithLMHead.from_pretrained("SEBIS/code_trans_t5_base_api_generation_multitask_finetune"),
    tokenizer=AutoTokenizer.from_pretrained("SEBIS/code_trans_t5_base_api_generation_multitask_finetune", skip_special_tokens=True),
    device=0
)

tokenized_code = "parse the uses licence node of this package , if any , and returns the license definition if theres"
pipeline([tokenized_code])

📚 詳細文檔

模型描述

本CodeTrans模型基於t5-base模型，有自己的SentencePiece詞彙模型。它在軟件開發領域的13個監督任務和7個無監督數據集上進行多任務訓練，然後針對Java API的API推薦生成任務進行微調。

預期用途和限制

該模型可用於為Java編程任務生成API使用建議。

訓練數據

有監督訓練任務的數據集可從Link下載。

訓練過程

多任務預訓練

模型在單個TPU Pod V3 - 8上總共訓練了500,000步，使用序列長度512（批量大小4096）。它總共有約2.2億個參數，採用編碼器 - 解碼器架構進行訓練。預訓練使用的優化器是AdaFactor，學習率調度採用逆平方根。

微調

該模型隨後在單個TPU Pod V2 - 8上總共微調了320,000步，使用序列長度512（批量大小256），僅使用包含API推薦生成數據的數據集。

評估結果

對於代碼文檔任務，不同模型在不同編程語言上取得了以下結果（以BLEU分數計）：

語言/模型	Java
CodeTrans - ST - Small	68.71
CodeTrans - ST - Base	70.45
CodeTrans - TF - Small	68.90
CodeTrans - TF - Base	72.11
CodeTrans - TF - Large	73.26
CodeTrans - MT - Small	58.43
CodeTrans - MT - Base	67.97
CodeTrans - MT - Large	72.29
CodeTrans - MT - TF - Small	69.29
CodeTrans - MT - TF - Base	72.89
CodeTrans - MT - TF - Large	73.39
現有最優模型	54.42