C

Chemberta Zinc Base V1

Developed by seyonec
基于RoBERTa架构的Transformer模型,专为化学SMILES字符串的掩码语言建模任务设计
Downloads 323.83k
Release Time : 3/2/2022

Model Overview

该模型通过预训练学习化学SMILES字符串的表示,能够预测分子序列中的标记,并可用于分子性质预测和结构分析

Model Features

化学SMILES专用预训练
在ZINC数据集上专门针对化学SMILES表示法进行预训练
分子性质预测能力
学习到的表征可用于预测毒性、溶解性、类药性等分子性质
注意力可视化
提供注意力机制可视化工具,帮助识别影响化学性质的重要子结构
迁移学习基础
可作为图卷积和注意力模型的特征提取器,或用于BERT微调

Model Capabilities

化学SMILES序列预测
分子变体生成
分子性质预测
化学子结构识别

Use Cases

药物发现
分子性质优化
预测和优化候选药物的溶解性、毒性等性质
化学教育
子结构识别教学
通过注意力可视化帮助学生理解影响化学性质的关键结构
材料设计
分子变体生成
在可探索的化学空间内预测分子的合理变体
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase