cubert-20210711-Python-1024開源模型 - 免費部署助力Python源代碼分析任務

首頁

Cubert 20210711 Python 1024

由claudios開發

CuBERT是一個基於Python代碼的上下文嵌入模型，專門用於處理源代碼分析任務。

大型語言模型

Transformers

其他開源協議:Apache-2.0 #Python代碼嵌入 #上下文窗口1024 #預訓練模型

下載量 22

發布時間 : 4/30/2024

模型概述

CuBERT是一個預訓練的語言模型，專門針對源代碼分析任務設計。它基於Python BigQuery數據集訓練，能夠理解代碼的上下文語義，適用於代碼補全、錯誤檢測等任務。

模型特點

源代碼專用

專門針對Python源代碼訓練，能更好地理解編程語言的語法和語義

長上下文支持

支持1024標記的上下文窗口，適合處理較長的代碼片段

預訓練模型

已在大量Python代碼上預訓練，可直接用於下游任務

模型能力

代碼上下文理解

代碼補全

代碼錯誤檢測

代碼語義分析

使用案例

代碼開發輔助

智能代碼補全

根據上下文預測可能出現的代碼片段

代碼錯誤檢測

識別代碼中的潛在錯誤或異常模式

代碼分析

代碼相似性檢測

比較不同代碼片段的語義相似度

屬性	詳情
模型類型	用於填充掩碼的模型
訓練數據	Python BigQuery數據集
標籤	代碼、CuBERT
論文鏈接	2001.00059

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Cubert 20210711 Python 1024

模型概述

模型特點

模型能力

使用案例

🚀 CuBERT：學習和評估源代碼的上下文嵌入

🚀 快速開始

📄 許可證

📚 詳細文檔

引用

信息表格