M

Materials.smi Ted

Developed by ibm-research
IBM提出的化學語言基礎模型,支持分子表示轉換與量子屬性預測等多種任務
Downloads 20.65k
Release Time : 7/25/2024

Model Overview

SMI-TED是基於SMILES的大型化學基礎編解碼模型,在9100萬分子樣本上預訓練,支持分子表示轉換和量子屬性預測等複雜任務

Model Features

多模態分子表示
支持SMILES字符串、SELFIES編碼、3D原子座標等多種分子表示形式
大規模預訓練
在PubChem的9100萬分子樣本(40億標記)上進行預訓練
雙訓練策略
結合掩碼語言模型和編解碼策略優化模型表現

Model Capabilities

分子表示轉換
量子屬性預測
SMILES編碼與解碼
分子特徵提取

Use Cases

材料發現
新型分子設計
通過分子表示學習生成潛在的新型化合物
藥物研發
分子屬性預測
預測候選藥物的量子化學性質
在MoleculeNet基準測試中表現優異
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase