code_trans_t5_base開源模型 - 免費部署，一鍵生成JavaScript函數文檔描述

首頁

Code Trans T5 Base Code Documentation Generation Javascript

由SEBIS開發

基於T5架構的代碼轉換模型，專門用於生成JavaScript函數的文檔描述

文本生成 #JavaScript函數摘要 #代碼文檔自動化 #T5架構優化

下載量 26

發布時間 : 3/2/2022

模型概述

該模型針對JavaScript編程語言進行預訓練，主要用於自動生成JavaScript函數的文檔描述。基於T5基礎架構，使用CodeSearchNet語料庫中的JavaScript數據集進行訓練。

模型特點

JavaScript代碼專用

專門針對JavaScript編程語言進行優化訓練

分詞代碼處理

對經過分詞的JavaScript代碼處理效果最佳，但也支持原始代碼

單任務訓練

專注於代碼文檔生成這一特定任務

模型能力

JavaScript代碼文檔生成

函數描述自動生成

代碼理解

使用案例

軟件開發

自動生成API文檔

為JavaScript函數自動生成描述性文檔

BLEU得分13.17（Base模型）

代碼理解輔助

幫助開發者理解複雜JavaScript函數的功能

🚀 用於JavaScript代碼文檔生成的CodeTrans模型

該模型基於t5-base架構，在JavaScript編程語言上進行預訓練，可用於生成JavaScript函數的描述或在其他JavaScript代碼任務上進行微調。它首次發佈於此倉庫，在經過分詞的JavaScript代碼函數上進行訓練，因此在處理經過分詞的JavaScript函數時效果最佳。

🚀 快速開始

以下是使用Transformers的SummarizationPipeline調用此模型生成JavaScript函數文檔的示例：

from transformers import AutoTokenizer, AutoModelWithLMHead, SummarizationPipeline

pipeline = SummarizationPipeline(
    model=AutoModelWithLMHead.from_pretrained("SEBIS/code_trans_t5_base_code_documentation_generation_javascript"),
    tokenizer=AutoTokenizer.from_pretrained("SEBIS/code_trans_t5_base_code_documentation_generation_javascript", skip_special_tokens=True),
    device=0
)

tokenized_code = "function isStandardBrowserEnv ( ) { if ( typeof navigator !== 'undefined' && ( navigator . product === 'ReactNative' || navigator . product === 'NativeScript' || navigator . product === 'NS' ) ) { return false ; } return ( typeof window !== 'undefined' && typeof document !== 'undefined' ) ; }"
pipeline([tokenized_code])

你可以在 Colab筆記本中運行此示例。

✨ 主要特性

基於t5-base模型架構，擁有自己的SentencePiece詞彙模型。
在CodeSearchNet語料庫的JavaScript數據集上進行單任務訓練。
可用於未解析和未分詞的JavaScript代碼，但對經過分詞的代碼性能更佳。

📦 安裝指南

文檔未提及安裝相關內容，可參考此倉庫進行安裝。

💻 使用示例

基礎用法

from transformers import AutoTokenizer, AutoModelWithLMHead, SummarizationPipeline

pipeline = SummarizationPipeline(
    model=AutoModelWithLMHead.from_pretrained("SEBIS/code_trans_t5_base_code_documentation_generation_javascript"),
    tokenizer=AutoTokenizer.from_pretrained("SEBIS/code_trans_t5_base_code_documentation_generation_javascript", skip_special_tokens=True),
    device=0
)

tokenized_code = "function isStandardBrowserEnv ( ) { if ( typeof navigator !== 'undefined' && ( navigator . product === 'ReactNative' || navigator . product === 'NativeScript' || navigator . product === 'NS' ) ) { return false ; } return ( typeof window !== 'undefined' && typeof document !== 'undefined' ) ; }"
pipeline([tokenized_code])

📚 詳細文檔

模型描述

此CodeTrans模型基於t5-base模型，擁有自己的SentencePiece詞彙模型，並在CodeSearchNet語料庫的JavaScript數據集上進行單任務訓練。

預期用途和限制

該模型可用於生成JavaScript函數的描述，或在其他JavaScript代碼任務上進行微調。它可以處理未解析和未分詞的JavaScript代碼，但如果代碼經過分詞，性能會更好。

🔧 技術細節

該模型使用t5-base架構，在CodeSearchNet語料庫的JavaScript數據集上進行單任務訓練，擁有自己的SentencePiece詞彙模型。

📄 許可證

文檔未提及許可證相關信息。

📊 評估結果

對於代碼文檔任務，不同模型在不同編程語言上取得了以下BLEU分數結果：

語言 / 模型	Python	Java	Go	Php	Ruby	JavaScript
CodeTrans-ST-Small	17.31	16.65	16.89	23.05	9.19	13.7
CodeTrans-ST-Base	16.86	17.17	17.16	22.98	8.23	13.17
CodeTrans-TF-Small	19.93	19.48	18.88	25.35	13.15	17.23
CodeTrans-TF-Base	20.26	20.19	19.50	25.84	14.07	18.25
CodeTrans-TF-Large	20.35	20.06	19.54	26.18	14.94	18.98
CodeTrans-MT-Small	19.64	19.00	19.15	24.68	14.91	15.26
CodeTrans-MT-Base	20.39	21.22	19.43	26.23	15.26	16.11
CodeTrans-MT-Large	20.18	21.87	19.38	26.08	15.00	16.23
CodeTrans-MT-TF-Small	19.77	20.04	19.36	25.55	13.70	17.24
CodeTrans-MT-TF-Base	19.77	21.12	18.86	25.79	14.24	18.62
CodeTrans-MT-TF-Large	18.94	21.42	18.77	26.20	14.19	18.83
現有最優模型	19.06	17.65	18.07	25.16	12.16	14.90