G

Gpt2 Zinc 87m

由entropy開發
基於GPT2風格的自迴歸語言模型,專門用於生成類藥分子或從SMILES字符串生成嵌入表示
下載量 404
發布時間 : 5/11/2023

模型概述

該模型基於ZINC數據庫中的約4.8億個SMILES字符串訓練,適用於化學和藥物發現領域的分子生成任務

模型特點

大規模分子訓練數據
基於ZINC數據庫中的4.8億個SMILES字符串訓練
高生成質量
在不同溫度設置下生成的分子具有高唯一性和有效性
嵌入表示能力
可從SMILES字符串生成有意義的嵌入表示
優化訓練
經過175,000次迭代訓練,批次大小為3072,驗證損失約為0.615

模型能力

分子生成
SMILES字符串嵌入表示
類藥化合物設計

使用案例

藥物發現
虛擬化合物庫生成
生成大量潛在藥物候選分子
在溫度1.0時生成99.9%唯一且99.9%有效的分子
分子表示學習
將SMILES字符串轉換為嵌入向量用於下游任務
化學研究
化學空間探索
生成新穎分子結構探索化學空間
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase