M

Materials.smi Ted

由ibm-research開發
IBM提出的化學語言基礎模型,支持分子表示轉換與量子屬性預測等多種任務
下載量 20.65k
發布時間 : 7/25/2024

模型概述

SMI-TED是基於SMILES的大型化學基礎編解碼模型,在9100萬分子樣本上預訓練,支持分子表示轉換和量子屬性預測等複雜任務

模型特點

多模態分子表示
支持SMILES字符串、SELFIES編碼、3D原子座標等多種分子表示形式
大規模預訓練
在PubChem的9100萬分子樣本(40億標記)上進行預訓練
雙訓練策略
結合掩碼語言模型和編解碼策略優化模型表現

模型能力

分子表示轉換
量子屬性預測
SMILES編碼與解碼
分子特徵提取

使用案例

材料發現
新型分子設計
通過分子表示學習生成潛在的新型化合物
藥物研發
分子屬性預測
預測候選藥物的量子化學性質
在MoleculeNet基準測試中表現優異
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase